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本 书 栅 广 了 自 17 世 纪 中 叶 以 来 三 百 余 年间 ,数理 往 计 学 发 展 
的 历史 . 设 定 的 读者 对 象 有 两 类 :一 是 本 专业 学 生 、 研 究 生 、 青 年 教 
师 和 科研 人 员 , 一 是 广大 的 对 这 门 学 科 有 兴趣 的 读者 . 阅读 本 书 只 
要 求 有 一 点 初步 的 概率 统计 知识 . 

对 前 一 类 读者 , 若 开 设 “ 数 理 统计 学 史 ” 访 门 课程 ,本 书 可 省 选 
作为 教材 或 套 考 书 . 现今 本 考 业 开设 统计 史 课 程 的 尚 不 多 ,这 时 本 
书 可 作为 基础 课程 的 一 种 补充 读物 . 因为 在 这 类 课程 的 教材 和 课 
营 讲 授 中 ,郑重 的 是 本 学 科 的 现状 . 由 于 篇 幅 和 时 间 的 关系 ,对 学 
科 中 一 些 重要 的 成 果 的 思想 源头 ,对 其 如 何 从 起 初 比较 粗粮 的 形 
芒 发 展 成 现今 比较 完善 的 形式 ,其 中 所 涉及 的 人 、 素 、 著 作 及 其 对 
本 学 科 发 展 史 上 的 作用 和 影响 , 讲 得 不 多 . 我 们 觉得 ,对 这 方面 能 
有 一 个 基本 的 了 解 ,是 本 专业 学 生 知 识 结构 中 应 有 的 一 部 分 . 

对 一 般 的 读者 ,我 们 重视 的 是 "统计 思想 ”的 养 成 ,笔者 认为 ， 
统计 学 和 不止 是 一 种 方法 或 技术 ,还 售 有 世界 观 的 成 分 一 - 它 是 看 
等 世界 土 万 事 方 物 的 一 种 方法 . 我 们 常 讲 某 车 从 统计 观点 看 如 何 
如 人 局, 指 的 就 是 这 个 意思 .但 统计 思想 也 有 一 个 发 展 过 程 . 因此, 统 
计 鼠 想 (或 观点 ?的 养 成 ,不 单 需 要 学 习 一 些 具 体 的 知识 ,还 要 能 馆 
从 发 展 的 眼光 ,把 这 些 知 识 连 绢 成 一 个 有 机 的 、 清 晰 的 图 景 , 获 得 
一 种 历史 的 厚重 感 . 

因此 ,作者 在 写作 中 ,力图 各 免 把 书写 成 一 个 流水 账 式 的 记 
录 1 而 把 注意 力 集 中 在 一 些 有 深远 影响 的 大 事 、 轧 想 源头 .重要 发 
展 之 癌 的 关系 .重要 人 物 的 思想 和 贡献 ,并 尽 可 能 表现 出 不 同时 期 
本 学 科 的 主要 特征 到 其 差异 之 所 在 . 当然 ,以 作者 的 学 办 ,要 完善 
好 这 到 这 一 目标 是 不 可 能 的 ,只 能 尽力 而 为 ,留待 广大 读者 和 同行 


专家 来 评 淹 . 

关于 书 的 内 容 , 在 “ 导 诗 ”中 有 上 比较 仔细 的 交代 . 越 写 这 篇 导言 
的 机 会 .作者 也 表述 了 目 己 对 数理 统计 学 这 门 学 科 的 性 质 的 一 些 
看 法 ,其 中 有 的 与 作者 以 往 在 其 他 著作 中 所 写 的 路 有 不 同 .对 这 些 
亲 题 * 和 专业 局 行 中 式 尚 无 一 至 的 意见 ,希望 能 引起 同行 们 鸡 这 个 问 
题 深入 的 思考 和 和 争鸣 . 

本 苍 的 写作 ,得 到 潮 元 教育 出 版 社 和 中 国 数学 会 的 支持 . 熏 实 
华 同志 为 杰 书 出 版 作 了 大 秘 的 工作 .和 写作 中 一 件 重 头 率 务 是 参考 
料 料 的 收集 ,没有 众多 的 同行 友好 的 大 力 协助 ,此 事 无 法 完成 , 这 
尝 人 人 人士 中 ,有 台湾 中 研 院 统计 学 所 梁 文 职 教授 ,杭州 大 学 林 正 炎 才 
授 , 中 国 科 技 太 学 起 林 城 教授 ,华东 师 大 王 静 龙 教 授 , 中 科 院 系统 
和 村 等 上 所 项 可 风 教 援 ,加拿大 约克 大 学 匡 月 华 博士 , 杰 南 大 学 事 博 成 
教授 及 朱 仲 义 阅 志 等 . 谨 借 瑟 机 会 对 能 们 的 氛 助 表示 衷心 的 感谢 


陈 希 库 
1998 年 8 月 10 目 
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写 这 篇 导言 的 上 且 的 ,主要 是 对 本 书 的 内 容 作 一 个 粗 线 条 的 ,但 
比较 全 面 的 介绍 .不 太 严 谍 地 说 ,可 以 把 读 一 本 书 比 之 于 游览 一 挛 
公园 或 一 姓名 胜 古 迹 . 游客 可 能 希望 在 入 门 之 前 ,能 有 购 悉 和 情 沈 的 
大 作 一 个 总 的 介绍 ,特别 是 提醒 他 哪些 是 要 紧 之 处 :以 便 游 览 暑 心 
中 有 底 . 希望 这 里 所 写 的 能 对 读者 起 一 点 这 种 “导游 ”的 作用 . 

这 本 书 是 写 " 数 理 统 计 学 ”的 历史 ,因此 ,对 这 门人 党 科 的 内 省 ， 
也 需要 说 明 一 下 . 本 来 ;这 个 问题 在 其 他 著作 中 已 名 有 涉及 ,读者 
都 是 半数 理 统 计 学 有 有 所 了 解 的 大, 似 不 必 在 此 丕 浪费 笔 旱 .但 以 笔 
者 个 人 的 观点 看 ,有 些 地 方 容 或 还 有 可 商 梭 之 低 或 要 点 强调 不 够 
不 当 之 处 ,也 存在 善 对 这 门 学 科 的 某 些 误解 ,因此 有 必要 把 秘 尊 的 
观点 清楚 表达 出 来 . 当然 ,这 只 是 个 大 的 一 种 看 法 . 

按 # 不 列 黄 百科 人 全书? 的 说 法 .( 数 理 ) 统 计 学 是 “收集 和 分 析 数 
据 的 科学 与 艺术 ”. 当然 ,数理 统计 堂 是“ 硬 " 科 学 ,不 是 通 和 名 意义 下 
的 艺术 tart). 这 里 强调 它 的 艺术 性 ,是 为 着 重 说 明 统 计 方 法 需要 
灵活 使 用 ,很 和 依 环 于 人 的 判断 以 至 旭 感 . 强调 这 一 点 很 有 好 处 , 它 
提醒 人 人 们 不 能 以 教条 式 的 态度 来 看 竺 数理 统计 方法 ,以 为 愉 要 记 
性 一 些 公 臣 和 方法 ,; 磁 到 和 什么 同 题 套 上 去 就 行 . 

《不 询 颠 百科 全 书 》 上 说 的 是 statistics”{ 统 计 学 ) ,并 未 标 出 
mathematical 一 词 .这 是 因为 在 此 名 词 的 使 用 上 我 们 和 西方 不 同 . 
西方 的 Statistics, 我 们 这 里 时 Marhematical Statistics. 加 上 
mathematical 这 个 字 跟 ,以 与 在 我 们 这 里 存在 的 被 视 为 一 门 社会 
科学 的 统计 学 加 亿 区 别 . 在 西方 ,也 有 Mathematical Statistics 的 
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提 落 , 孝 是 特 手 统 计 方 法 的 概率 一 数学 理论 基础 那 一 部 分 ,可 以 谢 
为 是 一 种 纯粹 数学 . 在 林 书 中 为 简化 丢 述 .党 将 数理 二 字 省 去 ,这 
当 不 数 引 起 误解 . 

在 “收集 和 分 析 数 据 ? 前 应 加 上 “用 有 效 揭 方法 ? 几 个 字 . 这 “有 
效 ? 包 含 两 个 舍 这 :大 力 物 态 时 间 的 节省 ,以 及 使 收集 来 的 数据 包 
售 尽 可 能 多 的 信息 ,并 有 一 种 便于 分 析 的 结 梅 . 分 析 方 法 的 有 茹 性 
包含 精度 的 提高 与 可 靠 度 的 增加 等 方面 . 统计 学 中 制定 的 种 种 优 
良性 标准 ,及 寻找 达到 这 种 标准 的 解法 ,者 是 为 了 这 个 目的 . 可 以 
说 ,这 有效" 二 字 反 映 了 数理 统计 学 作为 一 门 科学 的 实质 所 在 . 

上 所 收集 和 分 析 的 数据 是 要 带 随 机 性 的 , 即 可 以 通过 某 种 概率 
分 布 规律 来 描述 , 这 是 统计 学 与 其 他 处 理 数 据 的 学 科 ( 如 数值 分 
析 } 相 区 别 的 特征 .了 世 有 人 主张 统计 学 是 外 理 随 机 和 种 非 随机 数据 的 
党 科 ,对 此 笔者 不 天 苟同 . 这 并 不 意味 着 不 能 把 统计 学 中 的 :- 蛙 方 
法 和 和 概念 移 用 于 非 随 机 的 数据 . 例如 你 每 日 记 家 用 用, 到 岁 末 你 把 
逐日 的 费用 一 天 椒 漏 地 加 起 来 ,再 算出 日 平均 开销 . 这 也 是 一 个 统 
计 指 标 . 但 这 里 没有 统计 学 的 问题 ,因为 数据 反映 了 全 面 情 况 , 不 
需要 进行 包含 不 确定 性 的 统计 推断 . 坚持 这 一 条 使 数理 统计 学 有 
一 个 明确 的 研究 对 象 ， 

收集 和 分 析 数 据 的 目的 是 为 解决 特定 的 问题 ;因此 必需 可 居 
出 一 年 的 结论 ,以 至 为 采取 某 种 行动 提供 依据 和 建议 . “分析” 一 词 
广义 地 说 出 可 以 认为 包 舍 这 一 层 意思 .但 需要 明确 的 是 ,数理 统计 
学 只 是 从 数量 表现 的 层面 上 来 分 析 问 题 , 完 全 不 触及 问题 的 专业 
内 亩 . 例如 有 一 种 新 药 4 ,经 过 设计 合理 且 有 一 定 规模 的 试验 ,用 
妆 理 统 甘 方法 分 析 可 能 得 出 这 样 的 结论 :该 药 对 治 某 一 种 病 并 不 
颖 再 有 的 药 互 更 有 效 . 有 人 可 能 不 同意 这 个 结论 ,说 是 从 某 某 理 
由 看 4 应 比 瑟 更 有 获 . 辜 到 这 种 情况 ,数理 统计 学 者 不 参加 争论 . 
他 只 是 说 明 : 这 是 从 分 析 数 据 得 出 的 看 法 . 统计 方法 都 有 一 定 的 虽 
很 小 但 仍 属 可 能 的 犯 弄 谋 的 机 会 ,不 同意 的 人 可 以 从 学 理 上 来 研 
窒 这 个 问题 ,但 最 终 总 须 有 数据 资料 的 证 明 . 

笔者 认为 ;明确 沿 理 统计 学 方法 的 这 个 性 质 , 有 重要 的 意义 ， 
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它 罕 调 了 两 点: 一 是 数理 统计 方法 是 一 个 中 立 性 的 工具 . 这 中立” 
的 会 义 是 , 它 既 不 在 任何 问题 上 有 和 何 主 张 ,也 不 维护 任何 利益 或 在 
任何 学 科 中 坚持 任何 学 理 . 作为 一 个 工 其 , 谁 都 可 以 使 用 .如果 谁 
不 同意 这 种 方法 ;可 以 不 用 它 , 而 做 单纯 定性 式 的 讨论 . 如 根据 某 
种 设 定 的 理论 或 学 说 , 菜 事 该 如 何如 何 之 类 ,但 如 谁 要 把 他 的 说 法 
许 诸 实证 , 那 他 在 采集 和 分 析 数 据 时 ,就 应 遵守 数理 统计 学 方法 的 
规范 . 如 在 医学 试验 中 采用 双 育 法 ,设立 对 照 组 ,在 做 数据 分 析 时 
来 用 数理 统计 学 中 已 确立 的 并 由 经 验证 明 行 之 有 效 的 方法 等 ,这 
才能 使 自己 的 结论 建立 在 健全 的 科学 基础 上 ,得 到 公众 的 认可 . 

太一 尽 是 :由 于 数理 统计 方法 内 是 从 表面 上 的 数量 关系 来 分 
本 问题 ,其 结论 不 可 混同 于 国 果 关 系 . 这 里 有 一 个 著名 的 例子 . 
1957 年 ,有 两 位 学 者 在 不列颠 医学 杂志 》 上 发 表 了 一 系列 的 报 
告 : 指 出 吸烟 各 肺 凉 有 显著 的 联系 .这 件 事 惊 动 了 当时 最 权威 的 统 
计 学 家 费 敬 尔 ( 关 于 他 及 其 工作 ,本 书 有 很 多 篇 幅 论 及 ,此 外 不 
蓉 ), 他 一 是 不 性 成 将 此 问题 拿 到 公共 媒介 上 来 演 染 ,认为 应 当 是 
一 个 严肃 的 科研 问题 ,二 是 他 怀疑 认定 此 二 者 有 因果 关系 理由 还 
不 死 分 .他 认为 人 的 基因 构成 可 能 是 影响 此 二 者 的 公共 原因 ,并 引 | 
证 日 己 收 集 的 同 卵 双生 资料 的 统计 女 析 来 证 明 . 这 使 他 了 哆 大 一 场 
争论 ,这 问题 经 过 几 十 年 ,情况 依然 是 ;不断 收集 的 资料 证 明 这 二 
至 有 很 强 的 相关 , 即 数据 显示 吸烟 者 中 患 肺 况 者 的 比率 较 高 ,但 没 
有 确 飞 的 证 据 表 盟 是 吸烟 增高 了 患 肺 癌 的 可 能 性 ,因为 缺 生 排除 
了 可 能 的 干扰 (如 基因 构成 ) 的 有 说 服 力 的 统计 分 析 半 果 . 

数理 统计 方法 在 长 时 期 中 齐 遇 过 形形色色 的 批判 .早先 在 西 
隐 丰 人 从 道 德 的 观点 进行 批判 ,最 严重 的 是 在 前 苏联 的 斯 大 灯 时 
期 ,其 观点 在 我 国 20 世纪 80 年 代 以 前 也 有 很 大 的 影响 . 批判 的 内 
容 ,无 非 是 说 它 抹 杀 了 事物 的 本 质 . 美 化 资本 主义 和 丑化 社会 主 广 
之 类 ,明确 和 标示 数理 统计 方法 的 这 两 个 特点 -一 方法 的 中 说 


中 关于 这 力 面 的 情况 ,入 善 林 、 张 淅 编著 的 $s 统计 发 展 史 一 上 书 ip350 一 355} 有 有 鸭 
全 望 的 分 绍 , 可 避 驮 考 ， 
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性 和 工具 性 以 及 它 不 肯定 因果 关系 ,可 以 回答 这 尖 意 见 .使 数理 统 
计 学 者 村 在 一 个 契 骸 的 立场 , 惟 免 陷入 一些 无 谓 的 争论 . 

数理 统计 学 算 不 算是 数学 的 一 个 分 支 ? 笔 者 的 回 管 是 肯定 的 . 
理由 只 有 一 条 :数理 统计 学 所 研究 的 数据 收集 和 分 析 , 是 抽象 的 ， 
入 去 了 任何 实际 意义 的 数据 , 比如 + 检验 ,只 要 你 有 理由 上 条 定 数据 
是 撮 目 正太 分 布 , 则 不 论 这 数据 是 人 的 身高 也 好 ,是 产品 的 某 项 指 
标 也 好 ,或 其 他 什么 也 好 , 则 上 检验 都 可 以 而 且 用 一 样 的 方式 使 
用 . 故我 们 在 教科 书 上 只 要 写 *ri,…,r. 抽 自 正 态 人 分布? 就行 . 这 
正如 在 算术 中 我 们 说 1 十 2=3, 丝 讲 也 不 过 癌 这 1,2 是 何事 物 , 数 
学 是 镀 究 数 和 形 的 学 问 ,数理 统计 学 符合 这 个 标准 . 

有 的 数理 统计 学 者 讳言 “数理 统计 是 数学 的 分 支 ”, 是 因为 怕 
这 样 说 会 否定 或 冲淡 这 门 学科 的 高 度 实 用 性 . 其 实 这 种 殷 心 是 多 
余 的 . 数学 市 和 就 是 一 门 高 度 担 象 的 学 科 . 数 和 形 , 都 只 存在 于 人 
们 的 观念 中 . 故 在 西方 ,一 般 不 把 数学 放 在 自然 科学 之 列 . 但 人 们 
并 不 因此 而 否定 数学 的 实用 价值 . 认定 数理 统计 学 是 数学 的 分 专 ， 
办 了 这 门 学科 一 个 明确 的 定位 .将 其 作为 社会 科学 的 统计 党 之 下 
时 一 个 分 支 , 倒 还 有 些 困 蕉 之 外 ,有 即 数 理 统 计 学 在 性 质 上 与 社会 科 
学 完全 无 缘 . 当然 ,这 是 学 科 如 何 组 织 和 发 展 的 阿 题 , 从 更 有 条 于 
发 展 这 门 学 科 看 ,建立 独立 于 数学 的 系 、 研 究 所 和 学 会 ,与 社会 经 
济 统计 学 界 建立 更 密切 的 合作 关系 ,都 是 正当 有 益 的 举措 ,这 些 具 
体 措 施 不 应 与 学 科 的 性 质 和 定位 问题 温 背 起 来 . 


以 上 所 议 就 是 笔者 对 数理 统计 党 的 性 质 这 个 问题 的 看 法 ,其 
中 容 或 有 错误 不 妥 之 处 ,欢迎 同行 学者 提出 批评 指教 . 在 本 书 中 ， 
我 们 就 将 基本 上 本 着 这 个 认识 来 客 述 数理 统计 学 的 历史 . 

下 面 对 本 书 内 容 作 一 简略 的 介绍 . 

证 书 分 导言 .正文 十 章 和 一 个 “着 尾 语 ” 

第 一 章 是 介绍 概率 论 早期 发 展 的 历史 ,到 信和 努 利 的 {推测 术 》 
为 止 . 内 容 涉 及 有 关 概 率 的 基本 概念 如 何 从 博 奕 活动 中 产生 . 惠 更 
其 的 者 作 和 巴 斯 奖 - 费 尔 马 的 通信 ,这 一 切 为 伯 努 利 的 伟大 著作 的 
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出 现 作 了 谁 备 ,着重 介 绍 了 但 努 利 的 太 数 律 及 其 意义 ,也 涉 上 友人 季 闫 
于 概率 的 观点 . 写 这 一 章 , 是 朵 为 概率 论 与 数理 统计 学 有 密切 的 革 
系 . 在 相当 大 的 程度 上 这 个 内 容 也 可 以 算 作 统计 更 的 一 部 分 . 尤其 
是 太 数 律 , 它 可 流 说 是 整个 数理 统计 学 的 一 块 基 右 . 故 对 这 一 段 的 
历史 情况 应 当 有 所 了 解 . 

第 二 章 介绍 狼 莫 弗 的 二 项 分 布 正 态 有 还 近 的 工作 ,形式 上 讲 它 
也 是 属于 概率 论 的 范围 .但 这 项 研究 首次 沾 人 了 两 个 事物 : 正 态 分 
布 和 中 心 极限 定理 .这 二 者 部 是 整个 数理 统计 学 的 基石 ,其 在 数理 
统计 学 中 的 地 位 和 重要 性 ,怎么 强调 也 不 算 过 分 . 它 有 理由 被 写 人 
统计 完 的 篇 章 . 

第 三 章 介 绍 册 叶 斯 的 工作 和 贝 叶 斯 学 派 ,着 重 在 贝 叶 斯 本 人 
工作 中 的 原始 思想 . 这 个 内 容 放 在 书 中 靠 前 的 位 置 , 是 照顾 时 间 因 
素 , 困 页 时 斯 的 论文 发 表 在 18 捞 纪 中 期 . 中叶 斯 统计 在 教科 书 中 
一 般 有 所 介绍 ,但 贝 叶 斯 的 原始 息 想 如 何 , 比 如 说 他 那个 “ 贝 叶 斯 
假设 "(对 二 项 分 布 的 概率 pp 取 只 (0.1? 先 验 分 布 ? 是 如 何 产生 的 ， 
则 多 付 硕 如 ,而 只 有 了 解 这 一 些 , 才 能 对 这 一 学 派 的 精神 有 较 深刻 
的 把 所 . 

第 四 章 讨 沦 最 小 二 乘法 及 相关 联 的 发 展 的 历史 ,涉及 勒 让 德 发 
明 此 法 前 有 关 的 研究 , 勒 让 德 发 明 此 法 的 情况 ,包括 那个 著名 的 子 
咎 线 长 测量 向 题 ,介绍 了 最 小 二 乘法 产生 的 历史 ,以 及 特别 值得 -~ 
担 的 是 ,介绍 了 有 关 线 性 模型 早期 (1906 年 前 } 研 究 的 重要 情况 . 

最 小 二 潜 法 在 统计 学 中 的 地 位 ,主要 是 由 于 它 通过 线性 模型 
发 挥 作用 . 可 是 反 过 来 ,线性 模型 之 引 人 虽 最 初 系 出 自 天 文学 的 需 
要 ,但 哲 没 有 这 一 方法 ,该 模型 就 难于 发 挥 作用 . 二 者 在 一 定 程度 
上 是 一 神 共生 关系 . 对 这 个 * 共 生体 ”的 研究 到 19 世纪 末 已 达到 了 
很 请 的 水 平 , 现今 教科 书 上 必 有 的 内 容 如 高 斯 -马尔 科 夫 定理 .、 残 
差 平 方 和 了 服从 驻 分 布 及 最 小 二 磋 估 计 与 残 差 平方 和 独立 等 线性 
模型 理论 的 基石 ,在 1900 年 以 前 就 有 了 . 这 些 情况 如 今 在 著作 中 
很 少 握 发 ,使 读者 摘 不 清 这 模型 理论 的 源头 .本章 对 此 模型 提出 下 
到 以 上 发 展 为 止 的 情况 多 画 了 一 个 轮 廊 . 
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第 五 章 以 正 态 分 布 的 历史 为 主题 . 昌 则 狂 莫 弗 在 1730 年 代 已 
引进 了 正 态 分 布 的 形式 , 企 当 时 只 是 作为 一 个 数学 冰 数 ,此 分 布 之 
作为 分 析 统 计数 据 的 概率 模型 经 内 了 两 步 :第 一 步 是 高 斯 在 19 世 
纪 初 提出 正 态 误 差 理论 ,以 正 态 分 布 描述 随机 测量 误差 的 分 布 , 这 
使 狄 葛 弗 在 约 70 年 前 引进 的 那个 函数 首次 取得 了 "概率 分 布 "的 
身份 . 第 二 步 是 19 世纪 中 时 至 未 期 , 插 特 秦 特 在 社会 领域 和 高 尔 
准 等 在 生物 学 领域 中 ,引进 这 个 分 布 来 描述 统计 数据 了 ,于 是 正 访 
分 布 在 统计 学 中 大 行 其 道 . 本 章 描述 了 第 一 步 的 历史 ,包括 自信 利 
略 息 到 拉 善 拉 斯 止 有 关 误 差分 布 研 究 的 简单 情况 ,介绍 了 高 斯 引 
进 正 态 误差 理论 的 想法 ,也 简单 介绍 了 多 维 正 态 分 布 产生 的 情况 . 

这 一 章 也 顺便 介绍 了 有 关 " 偏 态 分 布 ” 的 历史 情况 .到 19 世纪 
后 期 ,一 些 学 者 发 现 正 访 分 布 并 非 “ 放 之 四 海 而 缘 准 ”他 们 希望 扩 ， 
太 统 计 分 析 中 所 能 使 用 的 分 布 的 范围 . 主要 的 发 展 有 两 个 方面 : 渐 
近 展 并 与 皮尔 名 分 布 族 . 后 者 对 统计 学 的 影响 较 大 ,是 我 们 重点 人 
绍 的 对 象 ,也 介绍 了 若干 局 时 代 学 者 的 一 些 批评 意见 . 

第 六 章 是 社会 统计 . 这 一 章 的 性 质 在 书 中 有 些 特 殊 . 因为 本 书 
是 以 讨论 数理 统计 学 中 为 任务 ,社会 经 济 统计 学 的 历史 不 在 范 用 
之 内 . 故 关 于 书 中 是 否 应 写 进 这 样 一 章 曾 考 虑 再 三 . 最 后 决定 写 入 
是 因为 考虑 到 社会 统计 学 家 的 活动 中 ,有 不 少 直接 或 间接 对 数理 
统计 学 发 展 有 影响 的 黄 献 ,一 部 数理 统计 学 史 应 当 对 此 有 所 反映 . 
章 名 为 求 简短 也 不 其 确切 , 较 确 切 的 提 法 应 为 “社会 经 济 统计 学 家 
对 数理 统计 学 的 贡献 ”. 由 于 作者 对 这 方面 的 情况 了 解 有 限 , 介 绍 
谈 不 上 系统 .只 能 涉及 一 些 较 重 大 的 事件 ,如 格 朗 特 的 {观察 } 一 书 
及 其 在 统计 史上 的 地 位 ,早期 人 品 学 家 所 做 的 假设 检验 的 工作 ,网 
特 泰 特 的 工作 及 抽样 调查 的 早期 历史 等 . 

第 七 章 介 绍 相 关 回 归 的 早期 历史 ,包括 高 尔 登 如 何 从 研究 遗 
传 学 问题 而 发 现 这 些 概念 的 故事 ,其 他 学 者 ,包括 埃 其 湿 斯 ,卡尔 


IO Le ee 


指 像 人 的 身高 之 类 对 实物 的 指标 的 测量 数据 . 在 早期 ,不 把 这 与 测量 谋 差 {对 
问 一 实 仁 某 指标 反复 测量 的 误差 ? 国 等 奢 待 - 


6 


“诺尔 于 和 约 尔 等 :如 何在 高 尔 登 发 现 的 基 栅 上 进一步 工作 ,使 一 
些 基 本 概念 明确 化 并 恒 它 在 数学 上 有 了 一 个 可 用 的 形式 .这 个 过 
程 终 止 于 1810 年 代 , 可 算是 相关 回 邮 方法 的 草创 种 描述 性 时 期 ， 
着 重 指 出 了 这 一 发 现 对 统计 学 发 展 进程 的 影响 , 即 为 下 一 阶段 (以 
小 样本 为 特征 ) 统 计 党 的 现代 化 作 了 铺 杏 ,并 使 英国 继承 欧洲 大 陆 
成 为 20 世纪 上 半 呀 国际 统计 学 发 展 的 中 心 . 

第 入 童 介 绍 小 样本 理论 ,时 间 幅 度 从 1908 年 到 1930 年 代 中 
期 ,小 样本 理论 和 方法 是 统计 学 告别 其 描述 性 时 代 而 走向 推断 时 代 
的 两 大 重要 标志 之 一 ( 男 一 个 标志 是 几乎 同时 代 的 奈 曼 ， 皮尔 必 理 
论 ; 所 杷 统计 问题 妇 结 为 优化 人 向 题 ). 可 以 写 的 内 容 很 多 ,我 们 把 重 
尽 放 在 三 件 太 事 上 :Student 关于 7 分布 的 工作 , 它 被 认为 是 小 样本 
上 时代 开创 的 标志 ; 费 歌 尔 1915 年 关于 样本 相关 系数 真确 分 布 的 工 
作 , 它 是 相关 回归 分 析 中 一 系列 小 样本 结果 的 开端 ,这 上 方面 的 研究 
继 经 了 从 高 尔 登 开创 到 卡尔 ， 皮尔 避 这 一 -上段 的 工作 ,使 之 达到 严格 
的 数学 标准 并 大 六 开拓 了 其 应 用 的 潜力 . 最 后 一 项 ,可 能 也 是 最 重 
雯 的 一 项 ,是 基干 费 黑 尔 发 展 下 检验 和 方差 分 析 的 情况 . 

伐 性 模型 之 介入 数理 统计 有 三 块 里 程 碎 . 第 一 块 是 高 斯 及 19 
世纪 否 二 学 者 的 工作 ,这 在 前 面 已 担 到 了 .第 二 块 是 卡尔 。 皮 和 尔 逊 
在 13 世纪 末 发 现 线性 模型 与 儿 元 正 访 分 布 的 联系 ( 针 元 正 态 的 回 
归 为 线性 ) ,把 相关 回归 分 析 纳 入 这 一 模型 的 放下. 第 三 块 则 是 费 
园 尔 将 线性 模型 中 自 变 量 取 值 离散 化 ,引入 FF 检验 和 方差 分 析 ， 
把 受 大 工控 制 的 试验 结果 的 分 析 也 收入 此 异型 的 版 图 . 此 后 ,很 天 
程度 芋 责 到 如 今 ,与 线性 模型 有 关 腾 的 廊 法 在 应 用 统计 中 一 直 起 
者 主导 的 作用 ,这 过 程 起 于 高 斯 而 完成 于 费 欧 尔 . 当然 ,后 来 的 学 
者 也 作出 了 很 大 的 贡献 , 德 他 们 创立 的 架构 得 到 充实 .确切 化 和 索 
样 化 ， 

第 九 草 的 主题 是 假设 检验 的 历史 ,主要 涉及 几 大 权威 的 工作 . 
卡尔 。 皮 尔 避 的 拟 合 优 度 检 验 , 费 驳 尔 的 显著 性 检验 与 “ 奈 曼 和 和 ( 爱 
根 " 到 未 进 的 故事 ”. 介绍 了 若 下 有 关 的 背景 情况 ,如 卡尔 ， 皮 和 尔 
示 的 工作 与 1890 年 代 他 注意 的 基 些 博 奕 性 质 的 间 题 及 悠 的 曲线 族 
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有 关 , 费 点 尔 的 思想 与 他 的 试验 设计 的 总 的 思想 有 关 , 以 及 其 他 学 
者 对 秦 曼 -皮尔 避 形 成 其 理论 的 基本 思想 的 影响 等 . 人 慌 这 一 章 的 机 
会 也 简略 介绍 了 我 国 杰出 统计 学 家 许 宝 又 教授 的 工作 . 许 教 授 在 概 
率 统计 方面 的 研究 成 就 是 多 方面 的 . 笔者 觉得 其 在 统计 学 中 影 啊 最 
大 的 可 能 是 与 线性 模型 有 关 的 检验 理论 问题 , 故 重 点 介绍 了 这 一 方 
面 . 这 是 笔者 个 人 的 见解 ;是否 受 当 也 请 同行 学 者 批评 . : 

第 十 章 是 关于 参数 估计 的 历史 情况 .介绍 了 皮尔 避 挎 怕 计 与 
费 鞭 尔 极 天 似 然 估计 及 二 位 学 者 园 绕 这 一 问题 的 争论 , 葛 软 尔 的 
充分 性 概念 的 提出 , 费 葡 和 尔 关 于 点 估计 大 杆 本 理论 的 框架 . 点 估计 
优良 性 研究 的 简单 情况 ,以 及 有 关 计 曼 置 信 区 间 理 论 及 费 软 尔 信 
任 推 断 法 的 情况 等 . 这 方面 材料 很 多 .以 细节 为 主 而 人 少 涉 及 原则 和 
概念 创 糯 的 工作 太 名 从 了 略 了 . 

最 后 写 了 一 个 ^ 卷 尾 话 ”. 笔者 由 这 样 一 个 标题 ,是 想 厦 重 其 非 
正式 的 性 质 . 这 不 是 一 个 总 续 , 作 者 的 意图 是 对 “后 费 骨 尔 时 代 的 
统计 学 发 展 形 扫 及 由 此 而 引起 的 大 二 当代 统 计 学 思潮 和 作 一 个 简 
述 , 其 中 也 渗 条 了 一 些 个 人 的 见解 .目的 是 想 提 出 这 样 一 个 问题 : 
“ 载 歌 尔 时 代 的 统计 学 "与 今日 统计 学 现状 是 雯 么 一 个 关系 ? 那 一 
个 时 代 的 统计 学 点 展 从 今日 看 其 得 失 何 在 ,并 对 我 们 展望 本 学 科 
术 来 能 浊 有 何 忆 示 . 这 题目 太太 ,不 是 作者 所 能 写 好 的 ; 权 和 作 扳 态 
3 引 玉 ,提供 志 守 一些 思考 的 痪 料 取 . 

章 末 坠 的 注解 ,大 多 涉及 数学 内 容 , 作 为 一 本 介绍 统计 中 的 
书 , 不 二 也 不 可 能 把 正文 中 涉及 的 数学 内 容 都 予以 证 明 ., 但 有 两 种 
情 剖 :一 怎 记 人 当时 研究 这 个 问题 时 的 做 法 ,这 有 史料 价目 ,可 帮 
且 对 正文 中 有 闫 史实 的 竹 述 增进 理解 . 例如 伯 努 利 对 其 大 数 律 的 
证 明 , 与 现在 在 教 本 上 见 到 的 大 不 相同 . 又 如 高 斯 是 经 过 怎样 的 推 
理 得 出 误差 正 态 分 布 的 . 二 是 有 些 事 实 的 证 明 , 虽 不 提 也 不 妨碍 对 
史实 的 理解 ,但 和 多少 可 作为 一 个 旁 注 , 且 其 证 明 也 不 是 常见 书籍 中 
所 多 碍 到 的 ,也 写 出 来 殿 对 数 竺 细节 有 兴趣 的 读者 参考 . 
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第 一 章 早期 概率 论 -一 一 从 
萌芽 到 《推测 术 》 


概率 是 一 个 事件 发 生 . 一 种 情况 出 现 的 可 能 性 大 小 时 数量 指 
标 , 介 于 0 与 1 之 同 . 这 个 概念 形成 于 16 谤 纪 , 与 揭 风 子 进 行 
赌博 的 活动 有 密切 关系 . 现 已 玲 确 指 此 械 念 最 旱 由 何 太 在 何 时 
提出. 

事件 有 ”可 重复 性 "和 “一 次 竹 " 之 分 .前 者 是 指 那 种 在 后 样 或 
基本 同样 的 答 件 下 ,原则 上 可 以 无 限 次 重复 的 事件 . 例如 * 迫 明子 ? 
这 个 动作 ,原则 上 是 可 以 在 相同 的 条 件 下 无 限 次 重复 , 故 任 何 一 个 
己 此 相 联 的 事件 ,如 “ 按 出 偶数 点 ”, 也 就 是 可 重复 的 . 我 们 注意 到 : 
这 里 实际 所 指 的 是 试验 ( 扩 般 子 ) 的 可 重复 性 , 及 如 “出 生 的 婴儿 是 
男性 ”这样 的 事件 ,可 以 极 大 量 重 复 仔 非 光 限 的 . 而 且 ,由 于 不 同 的 
人 情况 有 差异 ,这 或 者 可 以 影响 到 出 生男 出 的 可 能 性 ,因此 * 同 样 
条 件 "的 设 定 就 非 严 檬 成 立 , 对 这 种 情 帝 .也 将 其 作为 可 重复 性 事 
件 来 看 符 “ 一 次 件 事 件 ?* 的 含 穴 ,从 其 字面 上 即 已 明了 . 如 “2010 
年 1 月 1 日 北京 市 会 下 南 ”*”“2050 年 以 前 大 会 爆发 证 界 大 成 ” 
“火星 上 存在 生命 "之 类 ,都 是 一 次 性 事 人 性 的 例子 . 

现今 我 们 把 可 重复 事件 的 概率 称 为 客观 的 ,而 一 次 性 事件 的 概 
率 称 为 主观 的 . 客观 概率 的 决定 有 一 定 的 .公认 的 法 则 可 任 , 不 随 人 人 
的 主观 意志 转移 . 主观 概率 则 取决 大 的 主观 看 法 ,没有 一 个 公认 的 
方法 可 决定 一 个 惟一 的 值 . 例如 办 某 人 性 事 有 一 定 难 度 , 但 也 非 不 可 
能 . 在 未 进行 之 前 估计 其 成 功 的 可 能 性 ,10 个 人 有 十 种 说 法 . 哲学 家 


] 


认为 这 是 由 于 人 的 知识 的 不 完全 性 :如 果 关 于 某 事 件 有 关 的 知识 
“完全 "掌握 了 , 则 一 次 性 事件 的 概率 只 有 0 和 1 两 种 . 比如 若干 年 
后 ,大 们 摘 清 楚 了 火星 上 有 无 生命 , 则 ”火星 上 存在 生命 "这 个 事 人 性 
的 概率 ,就 能 给 予 确切 回答 一 一 当然 ,这 仍 要 取决 于 某 估 是否 了 解 
那 时 的 这 一 科学 进展 . 这 类 事 在 生 活 中 很 多 . 例如 医学 家 下 能 确切 
六 和解 , 某 种 病 不 存在 通过 空气 传染 的 可 能 性 ,但 对 不 了 解 这 一 点 的 
公众 来 说 ,其 可 能 性 大 小 则 有 主观 猜测 的 余地 . 主观 概率 可 以 反映 
一 种 信仰. 例如 ,对 “ 求 神 拜 佛 可 以 治 病 ” 的 可 能 性 ,不 同 信 人 性 的 人 人 
量 不 一 . 此 外 .处 辑 学 家 和 神学 家 对 主观 概率 也 有 其 解释 . 

客观 概率 有 两 种 形式 ,或 说 两 种 决定 方法 . 第 一 种 是 依据 该 事 
件 在 试验 太 量 重复 中 出 现 的 频率 . 例如 某 地 区 12 岁 以 下 的 儿童 有 
100 万 人 ,其 中 患 某 种 疾病 的 大 有 5 000 人 ,就 说 该 地 区 12 岁 以 下 
儿童 患 此 病 的 概率 为 0. 005. 这 实际 上 只 是 对 该 概率 的 一 种 估计 ， 
即使 生活 条 件 ( 包 括 医 疗 . 环 境 等 ;没有 变化 ,过 些 时 蛋 统 计 资 料 也 
会 有 变 , 而 这 个 估计 值 也 会 略 有 不 同 . 故 在 此 “概率 ”一 词 的 含义 也 
不 易 说 清楚 ,但 其 客观 性 不 容 置 疑 :上 述 估计 法 大 概 能 为 人 们 所 公 
认 ,不 存在 主观 估量 的 余地 . 

客观 概 宰 的 另 一 种 形式 是 :试验 的 可 能 结果 只 有 有 限 个 ,生根 
据 对 称 性 的 普 谍 ,和 任 一 种 可 能 结果 都 没有 比 另外 结果 占 优 执 的 地 
方 ,于 是 愉 能 认为 各 结果 有 同等 出 现 的 机 会 (等 可 能 性 ). 若 总 的 可 
能 结果 有 六 个 ,而 某 一 事件 包含 其 中 的 如 个 结果 , 则 该 事件 的 概 


率 为 冰 , 例如 接 一 个 均匀 山子 ,6 种 可 能 结果 有 同等 可 能 (这 实际 
上 是 被 取 为 “ 贷 子 均匀 ”这 一 前 提 的 定义 ).“ 挪 出 3 的 倍数 点 ”这 个 
事件 包含 2 个 结果 :6 和 3. 故此 事件 的 概率 为 过 一 于 . 若 般 子 不 均 


习 , 则 这 一 论证 失效 ,而 上 述 事 件 的 概率 需要 用 第 一 种 方法 , 即 通 
过 将 骨 子 投 拨 大 量 次 数 去 决定 之 ， 
这 和 镍 方式 定义 的 概率 现今 吗 仇 古典 概率 (与 此 相对 ,第 一 种 方 
起 定义 的 枝 率 叫 微 统计 概率 ).- 这 是 惟一 的 一 种 情况 ,其 中 概率 可 
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以 用 简单 明确 的 方式 去 定居 并 给 出 了 有 效 的 计算 方 纺 . 到 1933 
年 ,苏联 去 数学 家 柯 尔 莫 此 衬 夫 CA,H. Kolmmogorov，1903 一 1987) 
制定 了 概率 论 的 公理 体系 .其 中 对 概率 是 什么 不 加 定义 ,只 指出 关 
于 其 运算 所 必须 遵守 的 几 茶 规则 ,这 样 就 回避 了 如 何 定 多 概率 这 
个 难题 . 现今 谈 术 率 ,不 论 是 客观 主观 ,大 体 者 遵守 柯 氏 的 公理 体 
系 . 这 有 极 大 的 好 处 :不 论 对 概率 的 本 质 理 解 有 何不 同 ,在 运算 推 
理 土 天 家 都 遵守 公认 的 准则 ,而 不 各 行 其 是 . 

主观 概率 和 客观 概率 在 数理 统计 学 中 都 有 重要 地 位 . 前 者 是 
数理 统计 学 中 的 内 叶 斯 学 派 的 基础 《参看 本 书 第 三 章 ), 后 者 则 这 
今 仍 占领 了 数理 统计 学 的 大 部 分 阵地 ( 称 为 频率 学 派 ). 

皇上 典 概率 适用 的 一 个 暴 型 场合 ,就 是 以 都 仍 子 为 代表 的 机 遇 
性 赌博 .所 以 概率 论 萌发 于 这 一 活动 ,实在 是 理 有 固然 . 

使 用 人 锅子 作为 赌博 工具 油 狂 很 早 . 据 记 载 ,公元 960 年 左右 怀 
特 尔 德 大 主教 计算 出 据 三 个 骸 于 时 ,不 计 骨 子 次 序 所 能 出 现 的 不 同 
组 台数 ,有 56 种 (三 颗 全 同 6 种 ,两 颗 同 另 一 颗 异 30 种 ,三 颗 全 异 
20 种 ). 到 14 世纪 时 ,用 蜗 子 作 赌博 在 欧洲 已 蔚 成 风气 . 至 于 纸牌 ， 
述 至 1350 年 文献 中 尚 无 纪录 . 此 后 ,由 于 造纸 术 传 人 的 促进 ,以 高 
赌注 垢 纸牌 在 砍 济 的 富裕 阶层 中 日 疗 常 见 , 但 由 于 教会 的 反对 及 一 
些 国家 的 明令 禁止 ,纸牌 的 流行 在 很 长 时 期 内 远 不 及 角子. 直到 18 
世纪 初 , 继 牌 才 取代 骨 子 成 为 主要 同 上 其 . 另外, 玩 纸 牌 中 涉及 的 机 遇 
问题 比 骸 子 复 杂 得 针 , 故 促进 概率 论 诞生 的 功劳 归于 骨 子 . 

财 博 结果 既然 全 和 赁 机 通 , 参 赌 者 自然 会 甘心 各 种 情况 出 现 机 
通 的 大 小 . 在 早期 ,概率 (Probapbility ) 与 机 衣 chance 两 词 的 用 法 
有 长 册 : 前 者 用 子 主观 概率 而 后 者 用 子 客观 概率 ,直到 18 世纪 初 
才 渐 归于 统一 ,但 以 后 仍 有 学 者 坚持 这 种 区 别 . 另外 ,在 早期 ,人 们 
雇 多 用 “胜率 (odds) 一 词 ,其 与 机 过 的 关系 是 :车 甲 与 乙 峙 而 甲 胜 


的 机 过 为 地, 则 说 他 的 胜率 为 1: 2( 胜 率 为 双方 获胜 概率 之 比 ,一 
航 只 讲 整 数 比 ), 这 个 词 直到 现在 仍然 常用 ， 


仙 妆 忆 复 庆 前 ,要 亩 (或 机 通 , 以 下 不 如 区 别 ) 还 是 一 个 非 数 学 
概念 . 到 16 世纪 初 ,开始 有 一 些 意大利 数学 家 讨论 据 贷 子 中 各 种 
情况 出 现 的 机 遇 问 题 . 这 种 研究 结晶 出 了 前 文 提 到 的 古典 概率 定 
义 : 即 要 把 所 研究 的 情况 分 解 为 一 些 看 似 同等 可 能 的 简单 情况 ,其 
数目 与 全 部 可 能 结果 数 之 比 , 即 取 为 该 情况 出 现 的 概率 . 此 定义 最 
初始 自 何 人 已 不 可 考 , 因 为 这 些 早期 的 赌博 家 或 学 者 ,都 没有 著作 
流传 下 来 . 现今 为 人 所 知 的 一 位 是 卡 丹 诺 (G. Cardano,150] 一 
1576). 如 果 把 古典 概率 的 发 明 归 于 他 的 名 下 ,或 许 也 无 人 反对 . 


8 1.1 卡 丹 诺 的 著作 


- 卡 丹 庶 在 数学 上 知名 是 因为 他 发 现 了 一 般 的 三 次 代数 方程 的 
解法 . 其 在 概率 史上 的 地 位 ,是 因为 他 有 一 本 名 叫 《4 机 遇 博 弈 ?的 著 
作 【( 英 译 书 名 The Book of Games of Chance). 可 惜 的 是 ,此 书 到 
他 去 世 很 义 以 后 的 1663 年 才 得 以 发 表 , 其 时 关于 概率 论 的 若干 重 
时 著作 已 然 问 世 , 这 前 弱 了 该 著作 及 其 作者 在 概率 史上 的 地 位 和 
影 啊 (该 书 约 成 于 1564 年 ). 

卡 舌 语 早 年 党 过 医学 和 数学 , 曾 在 1526 年 获 医 学 博士 学 位 . 
1532 年 在 米兰 尾数 党 讲师 , 写 过 两 本 数学 著作 ,其 中 发 表 于 1545 
年 那 一 本 代数 教科 书 , 包 含 了 使 他 留 名 后 世 的 关于 三 次 代数 方程 
解 的 公式 . 虽说 卡 丹 诺 是 一 个 多 才 多 艺 的 人 人, 究 其 一 生 , 主 要 精力 
用 于 赌博 及 相关 研究 . 这 位 伟大 的 赌博 家 积累 了 丰富 的 经 验 , 以 之 
为 基础 写成 了 《机 明博 穿 》 这 本 著作 ,从 道德 ,理论 和 实 嵌 等 方面 对 
赌博 作 了 全 面 的 探讨 , 全 书 有 32 章 . 关于 这 一 研究 的 意义 他 写 道 ， 
正如 生理 上 的 疾病 需要 研究 一 样 , 赌 傅 这 种 社会 病 , 也 有 理由 和 作为 
-种 所 医治 的 疾病 来 研究 之 . 

在 这 部 著作 中 ,有 一 些 材 料 主 要 是 基于 届 个 人 的 实践 经 验 . 如 
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代 冬 时 候 宣 干 赌博 ,如 和 何 判断 赌博 是 否 公 正 , 如 和 何 识别 和 防 目 赌博 
中 的 欺诈 , 赌 汪 者 的 个 性 对 结局 的 影响 等 . 对 概率 史 有 意义 的 是 胃 
让 一 些 材 料 , 它 与 概率 概念 的 形成 有 关 , 例如 ,他 明 调 指出 能 子 鼎 
为 "诚实 的 ”thonest), 意 指 6 面 中 各 面 者 有 同等 机 会 出 现 . 他 广 为 
应 用 了 如 下 的 缚 果 :多 个 诚实 的 休 子 投掷 纺 果 有 人 同等 机 会 ,并 明确 
定义 胜率 是 有 利和 结果 数 与 不 利 结 潜 数 之 比 .在 卡 凡 诺 时 代 , 关 于 排 
刚 组 合 的 结果 所 知 室 守 , 央 此 他 的 书 中 ;包含 了 一 些 计算 全 部 i 等 
可 能 ) 靖 采 数 的 内 容 . 其 一 例如 下 : 抠 3 颗 改 子 ,; 先 分 成 3 种 状态 : 
a. 全 同 ;b. 二 同一 不 同 ;c. 全 不 同 , 分 别 有 6.30 和 20 种 可 能 .a 中 
每 一 个 只 有 1 种 徘 烈 ,b 中 每 个 有 3 种 而 ec 中 为 种 , 故 不 同 结果 
总 数 为 “ 
HT30X3+20x6=216. 
现在 我 们 直接 用 名 = 一 216 算出 这 个 结果 . 这 个 例子 也 从 侧面 反映 
了 当时 有 关 排 列 组 合 的 知识 其 为 初 神 . 书 中 包含 了 他 在 这 方面 的 
坷 干 研究 成 果 , 俩 如 他 算出 :n 个 相 民 物件 ,至 少 了 到 2 个 ,不 合 的 取 
法 为 2" 一 n 一 1. 他 对 组 合 系数 C7 当 ms11 列 了 表 , 并 证 明了 递 推 
公式 
(nn 一 走 二 1) 
~ 
由 此 他 导 册 现今 习 克 的 组 侣 公式 
(ne) (一 下 十 1) 


Ct 


Ce 


但 书 中 设 有 利用 这 个 有 力 的 工具 去 处 理 赚 博 中 情况 数 的 计算 问题 . 
及 一 战 费 解 的 是 : 乓 丹 诺 作为 一 个 积累 了 丰富 经 验 的 赚 博 家 ,在 其 
者 作 中 却 没 有 关于 在 实际 赌博 中 各 种 结果 上 出现 频率 的 记载 . 这 可 能 
是 由 于 他 及 同时 代 人 对 频率 与 概率 的 关系 ,特别 是 对 “频率 通 近 概 
率 这 一 后 来 被 伯 努 利 称 之 为 * 牧 人缘 知 ”的 事实 , 尚 无 所 认识 . 


中 这 里 当 热 很 定 了 :3 果 般 子 可 以 县 加 上 区 别 ,如果 不 加 区 别 , 则 所 得 56 种 不 同 
合 打 不 是 等 可 能 的 . 


卡 央 庶 的 4 机 时 博弈 4 一 书 对 当时 受 前 此 在 赌博 家 中 逐渐 形成 
的 一 些 概 念 , 邑 上 古典 概率 的 定义 种 计算 , 作 了 整理 各 总结. 除 此 以 
外 .他 还 在 1539 年 在 另 一 本 著作 中 ,提出 了 他 对 当时 引起 很 大 兴 
趣 的 "分 赔本 问题 "的 一 种 解法 . 此 问题 在 概率 论 发 展 史 土 起 过 重 
要 作用 ,值得 花 一 点 篇 幅 来 谈 谈 . 


$1.2 分 赌 本 问题 


.8 二 人 贿 博 ,各 出 注 金 a 元 .每 局 各 人 获胜 概率 都 是 过, 约 


是 : 谁 和 完胜 S 局 , 即 赢 得 全 部 注 金 2a 元 . 现 进行 到 有 44 胜 5, 局 ,B 
胜 S; 局 (5S, 种 S; 都 小 于 S)? 时 赌博 因 故 停止 , 问 此 时 注 金 2a 应 如 
何 分 配给 4 和 吾 , 才 算 公 平 ? 此 问题 文字 上 最 早 见 于 1494 年 帕 西 
奥 利 的 一 本 著作 ,是 对 3 一 6.S, 一 5 和 5: 一 2 的 情况 . 

由 于 对 ”会 平分 配 ?一 词 的 意义 没有 一 个 公认 的 正确 理解 ,在 
于 期 文献 中 出 现 过 关于 此 问题 的 种 种 不 同 的 解法 ,如 今 看 来 都 不 
正确 .例如 ,由 西 奥 利 本 人 提出 按 3 : 5; 的 比例 分 配 . 塔 泰 格 利 亚 
则 在 1556 年 怀疑 找到 一 种 数学 解法 的 可 能 性 ,他 认为 这 是 一 个 应 
由 法 官 解 决 的 问题 .但 他 也 提出 了 如 下 的 解法 :车 5S, 计 S;, 则 有 24 取 


问 自己 下 的 注 4, 并 取 走 如 下 的 注 的 全 /过 这 等 于 按 S 十 5; 一 


D2 D531 十 5; 的 比例 瓜分 注 金 .法 雷 斯 泰 尼 在 1603 年 根据 某 种 
理由 ,提出 按 25 一 1 十 S1 一 Ss 3 2S 一 1 一 S 十 S$; 的 比例 分 配 . 卡 丹 
启 在 其 1539 年 的 著作 中 ,通过 较 深 的 推理 提出 了 一 种 解法 . 记 
一 一 910i 一 1,2. 把 注 金 按 (rs 二 1) :mr 十 1) 之 比分 给 4 和 五. 
他 这 个 解法 如 今 看 来 虽然 仍 不 正确 ,但 有 一 个 重要 之 点 , 即 他 注意 
到 起 作用 的 是 S, 和 5; 与 S 的 差距 ,而 不 在 其 本 身 . 
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这 个 问题 的 症结 在 于 : 它 关 平 各 人 在 当时 状况 下 的 期 望 值 . 从 
以 上 这 些 五 花 入 门 的 解法 ,似乎 可 以 斌 为, 这些 作者 马 多 少 意 识 到 
这 一 点 ,但 未 能 明确 期 望 与 概率 的 关系 . 而 此 处 有 关 的 是 :假定 贿 
博 继 续 进 行 下 法 ,各 人 最 终 取 胜 的 概率 . 御 着 这 个 想法 问题 很 犁 解 
决 :至 多 再 风 r 一 i 十 ry; 一 1 局 , 叶 能 分 出 胜 人 负 . 为 4 获 脖 , 他 在 这 
局 中 至 人 少 须 胜局 : 因此 按 二 项 分 布 ,4 取胜 的 概率 为 


pa= 2 (2 7, 
而 吾 取 胜 的 概率 为 

Pe—=1— pa. 
注 金 应 按 pa ! ps 之 比分 配 结 和 丘 和 B, 因 2aps 各 2aps 是 A4,B 在 
当时 状态 下 的 期 望 值 . 这 个 解 是 巴 斯 罗 (5B. Pascal,1623 一 1662) 在 
1654 年 提出 的 . 他 贞 了 了 两 秘方 法 ,其 一 是 递 推 台式 法 ,其 二 是 用 
“ 书 斯 丹 三 角 "《 杨 炊 三 前 ). 1710 年 ,蒙特 姆 特 在 一 圭 信 中 给 出 了 
我 们 在 前 和 面 写 出 的 解法 ,有 旦 不 必 规 定 二 大 的 获胜 概率 相 遍 . 后 来 他 
艾 把 此 和 侣 题 推广 到 多 个 赌 徒 的 情形 . 

分 贿 本 问题 在 概率 史上 赵 的 作用 ,在 于 通过 这 个 在 当时 来 说 

较 复 杂 的 疗 题 的 探索 ,对 数学 期 望 及 其 与 概率 的 关系 ,有 了 启示 . 
有 的 解法 ,特别 是 巴 斯 刚 的 解法 ,使 用 或 隐 舍 了 若干 直到 现在 还 广 
为 使 用 的 计算 概率 的 于 具 , 如 组 合法 .着 推 公式 .条件 和 概率 和 全 概 


率 公 式 等 . 可 以 说 ,通过 对 这 个 问题 的 研究 ,概率 计算 从 初期 简单 
计数 和 步 人 较为 精细 的 阶段 . 


$1.3 巴 斯 噶 与 费 尔 马 的 通信 


巴 斯 噶 与 费 尔 马 (P. de Fermat,1601 一 1665) 的 人 名字 ,对 学 习 
过 中 他 以 上 数学 的 大 来 说 , 谅 必 不 是 生 . 巴 斯 哗 三 负 , 在 我 国 称 杨 
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泛 三 角 , 中 学 教科 书 中 已 有 所 上 帮 . 至 于 费 尔 马 , 因 其 * 费 尔 马 太 定 
理 ”( 不 玫 在 整数 工 ,y,z ;Tyz 隆 0 和 整数 % 宇 3, 二 十 y' 二 xz") 于 近 
年 得 到 证 明 , 和 名声 更 远 播 数 学 圈子 之 外 . 费 尔 马 在 数学 土 的 名 声 主 
要 畴 其 数论 方面 的 工作 ,其 在 概率 中 上 占 到 一 席 地 位 ,多 省 有 些 出 
平和 介 然 一 一 由 于 他 与 巴 斯 潮 在 1654 年 7 一 10 月 阳 来 往 的 了 7 封 售 
件 , 其 中 巴 致 费 的 有 3 封 . 

这 玫 圭 全 全 是 讨论 具体 的 赌博 问题 . 与 前 人 一 样 ,他 们 用 计算 
等 可 能 的 有 利 与 不 利 情况 数 . 作 为 计算 * 机 通 数 ” 即 概 挛 的 方法 -一 - 
他 们 没有 使 用 概率 这 个 名 称 . 与 新 人 相 比 ,他 们 在 方法 的 精细 和 复 
录 性 方面 大 大 前 进 了 . 他 们 广泛 使 用 组 合 工具 和 弟 推 公式 ,初等 概 
率 一 些 基 本 规律 也 都 用 上 了 . 他 们 引进 了 赌博 的 值 Cvaiue) 的 概念 ， 
值 等 于 赌注 导 以 获胜 概率 . 3 年 后 , 惠 更 斯 改 “ 值 ”为 “期 望 ” 
(expectation) ,这 就 是 概 坟 论 的 最 重要 慨 仿 之 一 一 一 (数学) 期望 的 
形成 和 命名 过 程 . 前 文 已 指出 :此 概念 在 更 早 的 作者 中 已 酝酿 了 -一 
奴 时 间 , 这 些 通信 中 讨论 的 一 个 重要 问题 之 一 是 分 赌 本 问题 ,还 讨 
论 了 时 复杂 的 输 光 问题 ; 甲 , 忆 ,二 人 各 有 贱 本 a 和 5 元 (a.5 为 正 刺 
数 ) ,每 局 输赢 下 元 ,要 计算 各 人 人 输 光 的 概率 . 这 个 问题 拿 现在 的 标 
准 看 也 有 相当 的 难度 . 由 此 也 可 以 看 出 这 组 通信 达到 的 水 平 及 其 在 
概率 论 发 展 史上 的 重要 性 . 有 的 学 者 ,如 丹麦 概率 学 者 哈 尔 德 ,认为 
已 ` 费 2 人 在 1654 年 的 这 些 信件 昔 定 了 概率 论 的 基础 . 这 话 有 相当 
的 道理 ,但 也 应 指出 ,这 些 通 入 的 内 容 是 讨论 具体 问题 ,没有 提炼 出 
并 明确 陈述 概率 运算 的 原则 性 的 东西 - 例如 ,他 们 视 为 当然 地 梧 用 
1 概率 加 法 和 乘法 定理 . 代 未 将 其 作为 一 般 原 则 凸现 出 来 . 

低 合 巴 . 费 2 人 进行 这 策 通 信 的 ,是 一 个 名 叫 德 梅 尔 的 大 ,他 
镶 阿 巴 斯 噶 请 教 几 个 有 关 赌 博 的 问题 . 1564 年 7 月 29 日 巴 斯 喷 
下 先 给 竟 尔 马 写 信 ,转达 了 这 些 问题 之 一 ,请 费 尔 马 解决 . 所 提问 
电 关 不 难 , 涉 知 何 以 巴 斯 嘲 未 亲自 回答 :将 两 颗 骨 子 毛 24 次 ,至 少 


挪 出 一 个 “ 双 6” 的 机 遇 小 于 去 (其 值 为 1 一 | 器 ~0.4914). 但 从 
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另 一 方面 看 , 投 两 个 休 子 只 有 36 种 (等 ) 可 能 结果 ,而 24 占 了 36 
的 去. 这 似乎 有 矛盾 ,如 何 解释 . 现今 学 过 初等 概率 论 的 读者 ,都 必 
能 毫 无 困难 地 回答 这 个 问题 ， 

巴 , 费 通 信 中 涉及 的 有 关 分 赌 本 问题 的 解法 ,包含 了 一 些 在 当 
日 看 很 先进 且 直 到 现在 仍 广 为 使 用 的 想法 和 技巧 ,值得 一 述 . 

以 7 和 mm 分 别 记 为 取得 胜利 ,4 .已 尚 须 赢 得 的 赌局 数 . 巴 其 
态 认 识 到 , 注 金 的 公正 分 配 只 应 与 = 和 ws 有 关 . 因为 若 赌博 继续 
下 去 ,4( 以 及 B) 最 终 取胜 的 概率 ,只 与 7 和 和 7; 有关. 记 此 概率 为 
em), 则 有 边界 条 件 ， 

cr 一 当 六 
pC) 一 0, 当 rr 0; 


cao 一 于 (1) 
且 成 立 弟 推 公 式 


er rr 了) 


马 斯 政和 在 此 用 了 全 概率 公式 , 即 考虑 苦 再 财 一 局 ,有 "4 胜 ”、“B 
胜 “两 种 可 能 . 巴 斯 噶 由 (1)、 2) 出 发 ,依次 算出 e(2,1),et]l,2)， 


Prf3lyvekrl:3yyef3ay 2yvef2 3 对 其 值 进 行列 察 , 他 妊 侣 出 一 
般 解 的 形式 ，: 


efr sr 一 de 村 (3) 
为 了 证 明 ， 先 验 证 (3) 适 合 边界 条 件 (1) ,这 不 难 . 巴 斯 嘲 用 归纳 法 
证 明 {3) 适 合 (2), 也 很 容易 ,读者 可 以 一 试 . 
费 四 配 的 解法 有 所 不 同 . 不妨 设 二 xo. 为 A 最终 取 胜 , 所 此 
周 的 局 数 可 能 为 fir 十] 十 rs 一 1( 完 备 事件 群 ), 期 间 B 取 
胜 的 局 数 ;一 Dr 一 上 苔 辣 胜局 , 则 到 4 最 终 取 胜 让 再 赌 
了 十 i 局 ,其 中 前 二 i 一 1 局 中 和 44 胜 7 一 1 局 ,而 第 r 十: 局 为 A 
胜 , 这 事件 的 概率 为 


lt D7! lr tr 
2 2 


[| 1 2 =C, 叶 
在 得 出 这 一 结果 时 已 用 到 了 二 项 式 定理 及 概率 乘法 定理 . 对 一 
D,.1,……:r: 一 1 相 加 ,得 


下 -- kr 十 T 


cr 用 . (4) 
这 时 耻 兰 了 使 用 概率 加 法 定理 . 用 以 上 可 以 看 出 : 巴 、 费 二 大 在 当 
Hf 已 了解 并 使 用 了 我 们 现今 初等 概率 计算 中 的 主要 工具 . (37、(4) 
两 个 解 在 形式 主 很 不 一 样 , 但 不 难 由 一 个 化 到 另 一 个 , 留 给 读者 
(本 章 末 注 1). 


31.4 囊 更 斯 的 《机遇 的 规律 》 


囊 更 斯 是 一 个 有 多 方面 成 就 的 .在 当时 声名 与 牛 罚 由 共 的 大 
科学 家 . 人 们 郊 知 他 的 贡献 之 -一 是 单 摆 周 期 公 趟 工 一 条 V 二. 他 


开 概 率 论 :的 早期 发 展 史上 也 占有 重要 地 位 ,其 主要 著作 《< 机遇 的 规 
侍 引 版 于 1657 年 ,出 版 后 得 到 学 术 界 的 重视 ,在 欧洲 必 为 概率 沦 
的 标准 教 本 长 达 50 年 之 入. 

该 着 作 的 写作 方式 不 大 像 一 本 书 , 而 更 像 一 篇 论文 .他 从 关于 
公平 晤 博 (fair game) 的 值 的 一 条 公理 出 发 ,推出 关于 “期 望 *( 这 蚌 
他 首先 引进 的 术语 ?的 3 条 定理 . 基于 这 些 定理 并 利用 递 推 法 等 工 
其 , 感 黑 斯 解决 了 当时 感 兴趣 的 一 些 机 秽 博 弈 革 癌 题 . 最 后 ,他 提 
出 了 5 个 问题 ,对 其 中 的 3 个 绍 出 了 管 案 但 未 加 证 基 . 

3 条 定理 加 上 11 个 问题 ,被 称 为 惠 更 斯 的 14 个 命题 .前 3 条 
如 下 述 : 

“机 名 簿 讲 , 扒 胜 雏 纯 天 运 气 ( 机 过 ;的 博 守 , 有 别 于 肥 胜 机 会 与 参与 者 技 世 有关 
的 博大 5 如 下 模 , 打球?. 
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命题 ! 若菜 人 在 赌博 中 以 等 概率 二 得 <.6 元 , 则 其 期 望 为 


> 
元. 


命题 2 若 某 人 在 赌博 中 以 等 概率 二 得 a.6 和 < 元 , 则 其 期 户 
六 [cz TE 元 ， 


傅 题 3 若 基 人 在 赌博 中 以 概率 p;yg(tp 十 9 二 1) 得 #2, 元;: 则 
其 期 理 为 pa 十 92 元 ， 

看 了 这 些 命 题 ， 现 代 的 读者 或 许 会 感到 悍 了 加 :， 为 何 一 个 应 取 
为 定义 的 和 东西， 妥当 作 需 要 证 明 的 定理 . 答案 在 于 ， 这 反观 了 当 
时 对 纯 科 学 的 一 种 会 认 的 处 理 方 法 ， 即 应 从 尽 可 能 少 的 “第 一 上原 
理 ”(first principle ， 即 公理 ) 出 发 ， 把 其 他 内 容 推 演出 来 ， 惠 重 
斯 只 从 一 条 公理 刚 发 而 导出 上 述 命 题 ， 其 推理 颇 为 别致 ， 此 好 不 
细 述 了 . 

这 几 个 傅 题 是 期 望 概念 的 一 般 化 . 此 前 涉及 或 隐 含 这 一 概念 ， 
只 是 相当 于 全 最 3 中 上 二 4 的 特例 , 即 注 金 乘 取胜 概率 ,因而 本 质 
上 恒 有 超出 概率 这 个 概念 的 范围 , 惠 更 斯 的 合 题 将 其 一 般 化 了 ,是 
这 个 重要 概念 定型 的 决定 性 的 一 步 . 实际 上 , 据 串 更 斯 的 命题 不 难 
证 明 : 和 看 革 人 在 赌博 中 分 别 以 概率 pi spitp 十 十 ps 二 1) 得 
ci 元 : 则 其 期 望 为 pra 十 十 prasy. 这 与 现代 概率 论 教科 书 
中 关于 离散 随机 变量 的 期 请 的 证 义 完全 一 至 . 

余下 的 11 个 命题 及 最 后 的 5 个 问题 ,都 是 在 形形色色 的 赔 博 
到 性 约 定 下 ,去 计算 各 方 到 胜 的 概率 ,其 中 命题 4 一 9 是 关于 2 人 
和 过 人 的 分 赌 本 问题 . 对 这 些 及 其 他 问题 , 惠 更 斯 都 用 了 现行 概率 
沦 教科 上 书 中 初等 概率 计算 方法 ,通过 列 出 一 定 的 方程 求解 ,大 体 上 
二 巴 斯 喉 的 做 法 相似 . 这 种 方法 后 来 被 伯 努 利 称 为 * 患 宣 斯 的 分 析 
方法 ”最 后 5 个 问题 较 难 一 些 , 其 解法 的 技巧 性 也 较 强 . 现 举 其 一 
为 例 :A4、B 二 人 约定 按 ABBAABBAABB:…-… 措 两 盯 骨 子 , 即 4 
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先 邱 一 次 ,然后 从 五 开始 轮流 各 丘 两 次 . 若 恕 搓 出 和 8 点, 则 本 
胜 ; 若 瑟 所 出 和 ?7 点; 则 B 胜 . 求 4、B 获胜 的 概率 . 


4 在 一 次 投掷 时 部 出 和 6 的 概率 pn 一 习 , 而 互 在 一 次 投 邱 时 


掷 出 和 7 的 概率 为 ps 一 六 一 于. 记 @ 一 1 一 pgs 一 1 一 p, 又 记 


ec, 一 在 第 :1 次 投掷 完 时 4 .五 都 未 取胜 ,在 这 一 条 件 下 4 最 终 取 
胜 的 概率 , 则 利用 全 概率 公式 ,并 注意 到 约定 的 投 撞 次 序 , 可 以 列 
el 一 让 1 十 nez ee 一 人 Be 2 一 人 Bi ed 看 4 十 CAel， 

由 此 容易 得 出 
Patl+gags) 10 355 
1 gig) 22 631° 


咯 小 于 三 . 故此 赌 法 对 4 不 利 


机 选 博 灾 在 概率 概念 的 产生 及 其 运算 规则 的 建立 中 ,起 了 主 
于 由 作用 . 这 一 点 不 应 当 使 人 感到 奇怪 ;明说 机 遇 无 时 不 在 ,但 要 
精确 到 数量 上 去 考虑 ,在 几 百 年 前 那 种 科学 水 平 之 下 ,只 有 在 像 掷 
怠 十 这 舌 很 简单 的 情况 下 才 有 可 能 .但 这 门 学 科 建 立 后 , 即 脱离 财 
博 的 范围 而 找到 了 多 方面 的 应 用 . 这 也 是 一 个 有 趣 的 例子 ,表明 一 
和 神 看 来 无 瘟 的 活动 4《 如 赌博 ? ,可 议 产 生 对 人 类 文明 概 有 价值 的 剖 
产物 . 

把 概率 论 由 局 限于 对 赌博 机 遇 的 讨论 拓 般 出 去 的 转折 点 和 标 
志 ;: 应 是 1713 年 伯 努 利 划 时 代 著 作 4 推 测 术 3》 的 出 版 ,是 在 惠 更 斯 
的 $ 机 机 的 规律 3 出 版 后 56 年 . 截至 惠 殉 斯 这 一 著作 为 下 ;内容 基 
本 上 全 限于 据 骨 子 等 赌博 中 出 现 各 种 情况 的 概率 的 计算 ,而 怕 努 
机 这 本 著作 不 仅 对 以 前 的 或 果 作 了 总 结 和 发 挥 ,更 提出 了 “大 数 定 
律 ” 这 个 无 论 从 理论 和 应 用 角度 夏 都 有 着 根本 重要 性 和 的 命题 ,可 以 
说 其 影响 一 直达 到 今日 而 不 衰 . 其 对 数理 统计 学 的 发 展 也 有 不 可 
伯 量 的 影响 , 许 密 统计 方法 和 理论 都 是 建立 在 大 数 定 律 的 基础 上 . 
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有 的 概率 史家 认为 ,这 本 着 作 的 出 版 ,标志 省 概 率 概 念 广 长 的 形成 
过 程 的 终结 写 数 学 概率 论 的 开端 . 

仍 定 有 一 个 事件 4. 根据 茶 种 理论 ,我 们 算出 其 概率 为 P(A) 
一 pp. 这 理论 是 否 正 确 呢 ? 一 个 检验 的 方法 就 是 通过 实际 观察 ,看 
其 结果 与 此 理论 的 推论 一 一 PtA4A) 二 pp 是 否 符 合 .或 者 ,一 开始 我 
们 根本 就 不 烟 媳 (4) 等 于 密 少 ,而 希望 通过 实生 观 察 去 入 计 其 
值 . 这 些 包 含 了 数理 统计 学 中 两 类 重要 问题 的 形式 一 一 检验 与 村 
十, 这 个 检验 或 估计 概率 p 的 问题 ,是 数理 统计 党 中 最 常见 、 最 基 
本 的 两 个 问题 . 

要 构 阁 具 体例 子 , 最 方便 的 做 法 是 使 用 古典 概率 模型 . 拿 一 个 
生子 ,里 面 装 有 大 小、 质地 一 样 的 球 4 十 b 个 ,其 中 白 球 a 个 , 黑 球 上 
个 . 这 时 ;随机 从 后 中 抽出 一 球 ( 意 指 各 球 有 间 等 可 能 被 机 出 }, 则 


“抽出 之 球 为 魏 球 ”这 事件 4 有 概率 P 一 二 7 如 果 不 知道 a.6 的 


比值 ; 则 pp 也 不 知道 . 但 我 们 可 以 反复 从 此 咎 内 抽 球 (每 次 抽出 记 
下 其 颜色 后 再 放 问 租 中 ). 设 抽 了 NN 次 ,发 现 白 球 出 现 苹 wy 次 , 则 


从 > 、 
用 去 估计 p. 这 个 售 计 会 有 其 程度 不 确定 的 误差 ,但 我 们 直观 


上 会 觉得 ,抽取 次 数 入 人 靖 大 ,误差 一 般 会 缩小 . 这 一 点 如 伯 努 种 所 
六, 是 " 喇 怕 最 时 繁 的 人 ,也 会 经 由 他 的 本 能 ,不 须 他 人 的 教诲 而 理 
解 的 但 这 个 命题 却 无 人 能 给 出 一 个 严格 的 理论 证 明 . 

伍 努 利 决 心 着 手 解 决 这 个 问题 ,其 结果 导 独 了 以 他 的 名 字 命 
名 的 太 数 定律 的 发 现 . 这 个 发 现 对 概率 论 和 数理 统计 学 有 极 重 大 
的 意义 , 伯 努 利 把 这 一 研究 成 果 写 在 他 的 著作 4 推测 术 》 的 第 4 部 
分 中 ,是 该 者 作 的 精华 部 分 . 由 于 该 者 在 概率 统计 史上 土 的 重要 意 
义 ， 值 得 对 伯 和 舅 利 其 人 及 此 书 的 整个 面貌 先 作 一 点 介绍 . 
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§ 1.5 《推测 术 ; 前 三 部 分 内 容 提 要 


伯 努 利 1654 年 出 生 于 瑞士 巴塞 尔 . 在 他 家 族 的 成 员 中 ,程度 不 
同 地 对 数学 各 方面 作出 过 贡献 的 :至少 有 12 人 ,有 5 人 在 概率 论 廊 
面 ,其 中 杰出 的 踪 他 本 人 外 ,还 有 其 弟弟 约 短 与 倒 几 尼 科 近 斯 . 

介 努 利 的 父亲 为 他 规划 的 人 人 生 道 路 是 神职 人 人 员 , 但 他 的 爱好 
是 数学 .他 对 数学 的 贡献 除 摄 率 论 钉 ,还 包括 微 积 分 .微分 方程 和 
变 分 法 等 ,后 者 包含 著名 的 悬 链 线 问题 . 他 是 牛顿 和 芋 布 尼 兹 的 问 
时 作 人 并 与 后 者 保持 密切 的 通信 联系 ,因而 很 了 解 当 时 新 兴 的 微 
积分 学 的 进展 . 学 者 们 认为 他 在 这 方面 的 贡献 ;是 牛 . 芋 以 下 的 第 
一 人 .他 对 物理 学 和 力学 也 作出 过 贡献 . 

他 与 患 更 斯 长 期 保持 通信 联系 ,他 细 研读 过 他 的 著作 * 机 遇 的 
规律 3》, 由 此 局 发 了 他 对 概率 论 的 兴趣 . 

从 他 与 葬 布 尼 兹 的 通信 中 ,可 知 他 写 * 推 涧 术 》 这 一 著作 是 在 
他 生命 的 最 后 师 年 .在 1705 年 他 去 世 时 ,此 书 尚 未 整理 定稿 . 出 于 
家 族 内 部 的 问题 ,整理 和 出 版 跟 稿 的 工作 , 迟 迟 未 能 实现 . 先是 其 
壮 媚 因 对 其 弟 约翰 的 不 六 任 ,不 愿 把 整理 出 版 的 事 委 托 给 他 ,后 来 
又 拒绝 了 攀 济 一 位 富有 的 学 者 捐资 出 版 的 建议 . 最 后 在 莱 布 尼 兹 
的 台 促 下 ., 才 块 定 由 其 侄 儿 尼 科 拉 斯 来 承担 这 忻 事 情 . 尼 科 拉 斯 也 
是 当时 重要 的 数学 家 ,与 欧 拉 和 汪 布 足 兹 保持 通信 关系 . 当时 尚 无 
科学 期 刊 ; 学 者 之 间 的 通信 和 是 学 术 交 流 的 一 种 重要 方式 . 

《推测 术 》 一 书 共 239 页 ,分 四 个 部 分 . 第 一 部 分 (p. 2 一 71) 
对 # 机 遇 的 规律 } 一 书 作 了 和 仔细 的 注解 ,总 量 比 惠 更 斯 原 书 长 4 税 . 
第 二 部 分 (p. 72 一 137) 是 关于 排列 组 人 台 的 系统 的 论述 . 第 三 部 分 
‘p. 138 一 209) 利 用 前 面 的 知识 ,讨论 了 一 些 使 用 吉 子 等 的 赌博 问 
题 . 第 四 部 分 4p.210 一 239) 是 关于 概率 论 在 社会 .道德 和 经 济 领 域 
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中 的 应 用 , 共 中 包括 了 本 书 的 精华 . 音 定 了 本 书 在 概率 史上 不 本 的 
地 位 的 ,以 他 的 名 字 命 名 的 大 数 定律 一 一 大 数 定律 的 名 称 不 是 出 
自 本 书 ; 它 首 见 于 波 哇 秘 1837 年 的 一 篇 著作 中 . 此 书 如 般 了 这 一 
部 分 , 则 很 可 能 会 像 茶 些 时 期 概 宰 论著 作 那 样 泽 没 无 闻 ,或 至 多 作 
为 一 本 一 般 著 作 被 评价 . 本 书 最 后 有 一 个 长 35 页 的 附录 ,以 局 友 
大 通信 的 形式 讨论 网 球 比 赛 中 的 计 从 问题 . 

推测 术 》 的 前 三 部 分 ,是 古典 概率 的 系统 化 和 深化 . 相 比 于 此 
前 的 概率 论 凌 作客 是 讨论 具体 的 赌博 取胜 概率 的 计算 ,本 书 则 更 
着 重 指 导 这 种 计算 的 一 般 规 律 及 其 数学 证 明 , 并 以 数字 实例 来 解 
释 其 应 用 . 这 已 与 现代 编写 教科 书 的 模式 相符 合 . 如 在 论 及 有 重复 
操作 的 博 讲 一 一 例如 在 一 局 赌博 中 涉及 把 一 盯 损 子 报 据 5 次 时 . 
他 指出 在 每 次 重复 中 所 涉及 的 事件 概率 不 变 , 且 各 次 重复 独立 .前 
人 的 著作 中 也 网 认 了 这 -点 ,得 伯 努 利 第 一 个 将 其 明确 指出 , 因 
此 ,如 今 符合 这 样 条 件 的 模型 被 称 为 但 努 利 概 型 .他 明确 指出 了 滤 
立 情 部 下 概率 好 法 定理 的 表述 形式 ,在 此 基础 上 严格 证 明了 二 项 
概率 公式 Cp'g” .他 江 创 了 通过 无 穷 级 数 求 和 去 计算 概率 的 方 
法 . 在 伯 努 利 时 代 无 穷 级 数 尚 属 新 的 数学 研究 锁 域 ,而 他 在 这 方 而 
有 重要 页 献 . 

在 第 二 部 分 中 ,他 首次 引进 了 “排列 ”的 概念 ,证 明了 x 个 柑 蜡 
物件 的 不 辐 排 列 数 为 #1, 而 # 个 中 取 r 个 排列 的 不 同 排列 数 为 #5 
Cn 一 1)tn 一 r 十 1). 他 也 得 出 了 = 物件 不 全 相 异 时 排列 数 的 公 
式 . 在 组 人 台 方 而 ,他 研究 了 组 合 系 数 的 性 质 . 可 以 重复 的 组 合 数 , 超 
几何 分 布 ,特别 是 正 整 数 守 次 和 的 表达 式 


Ss pl mn™ AS mh m- 2 十 1 
tr 一 产 二 十 下 十 之 六 ByCY_ an (5) 
Bs, 叫 介 努 利 常 数 , 其 最 初 几 个 值 为 
,二 1 召 一 一 工 ， 瑟 一 二， B,—— 1. 


6 30 42 
一 般 值 由 下 式 妇 纳 地 定 出 : 


五 = + 包 生 Bs kl, 2 | 


在 人 怕 弩 利之 朋 , 已 有 一 些 数 学 家 ,其 中 包括 葬 布 尼 背 ,研究 过 
组 合 系数 , 但 较 系 统 的 著作 始 于 * 推 测 术 》 一 书 . 故此 书 在 长 时 期 内 
戌 为 乒 花 使 用 的 排列 组 合 教 本 ,其 出 版 不 独 对 和 概率 论 ,对 组 合 学 也 
是 -个 重要 事件 . 

在 第 三 部 分 中 ,人 努 利 运 帅 前 两 部 分 中 发 展 的 新 工具 ,去 讨论 
那 一 类 兽 由 巴 斯 噶 . 费 尔 马 和 旧 更 斯 等 人 讨论 过 的 赌博 问题 . 他 一 
菇 讨论 了 24 个 在 当时 流行 的 赌博 问题 ,今日 看 都 不 难 . 在 计算 等 
可 能 数目 时 用 组 合法 ,并 使 用 加 法 磁 法 定理 .条 件 概率 发 递 推 法 等 
土 具 去 计算 概 兴 .例如 问题 14:4 先 搓 一 均匀 贫 子 , 若 得 到 点 ， 
则 再 投 撞 x+ 题 肯 子 ,以 y 记 这 工藤 子 点 数 之 和 . 若 ye<12,4 输 1 
6; 若 y>12,4 赢 1 元 : 若 y 一 12, 不 襄 不 输 , 求 4 赢 的 期 望 值 , 即 
Py 之 12) 一 Pty 必 12). 问题 21: 一 副 纸 牌 ?x 张 ,其 中 居 张 标 上 ea， 
其 余 的 标 上 & 4 先 抽 1 张 ,车 为 a, 则 赢 1 元; 若 为 5, 则 不 放 回 这 
一 张 而 再 抽 1 张 ;大 为 a,4 输 1 元 ,车 为 5,; 则 按 开 始 时 的 规则 继 
续 ( 但 己 抽 出 的 两 张 6 不 放 回去 ) ,一 直到 分 出 输赢 或 牌 光 为 止 , 求 


4 赢 的 期 望 值 有 兴趣 的 读者 不 妨 自 己 算 一 算 . 答案 :一 汪 14 以 


在 该 书 的 附录 中 , 伯 努 利 讨 论 了 一 些 关 于 网 球赛 中 取胜 概率 
的 计算 问题 . 这 些 问题 的 难度 较 大 ,其 一 个 较 简 单 的 讽 子 如 下 ,A、 
8 二 人 人 打 网 球 . 每 局 A 胜 的 概率 为 六 : 召 胜 的 概率 为 了 [pp 全 0 9 全 
bp 十 2 一 1). 规定 : 赛 至 一 方 领先 不 少 于 2 局 , 且 领 先 一 方 至 少 已 
胜 4 局 时 ,该 方 取 有 性, 求 4 取胜 的 概率 . 符 案 是 ( 注 2)， 
Cr 十 5r 十 11r5 十 15r1》 

(rrr 十 S57 十 1 

其 中 -一 入. 
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(7) 


$1.6 关于 概 泰 的 几 点 看 法 


在 & 推 测 术 ;中 ,和 伯 努 利 对 概率 这 个 概念 ,发 表 了 看 于 对 后 世 有 
影 哺 的 观点 .他 也 是 采取 把 概率 分 为 “主观 概率 ”和 ”客观 概率 ”的 
立场 ,其 余 也 有 的 兼 淋 了 前 人 的 看 法 ,值得 注意 的 新 观点 有 以 下 
几 条 : 

.从 把 客观 概率 明确 区 分 为 两 类 :其 一 是 “可 以 先 验 地 计算 ” 
的 概率 , 另 一 是 “后 验 地 计算 ”的 概率 . 用 现在 的 术语 说 ,前 者 指 古 
典 概 率 , 其 计算 依据 建立 在 对 称 性 (这 是 一 种 先 验 的 事实 ,不 须 经 
过 计算 ;基础 上 的 等 可 能 性 由. 后 者 指 统 计 概 率 , 如 “出 生男 机 ”这 
个 事件 的 概率 ,可 通过 太 量 观察 的 结果 (后 验 } 去 计算 之 .注意 此 朴 
“ 先 验 ”一 词 的 合 义 ,与 由 叶 斯 统计 (第 三 音 ) 中 * 先 验 ” 的 意义 不 同 . 

2, 伯 努 利 对 事物 采取 了 一 种 机 械 决 定论 的 观点 , 就 是 说 ,世界 
寺 的 一 切 事物 都 受到 严格 的 因果 律 的 支配 . 他 分 析 抑 设 子 这 个 已 
于 ,认为 : 吾 把 一 切 有 关 条 件 , 了 包括 角子 形状 大 小 .质量 分 布 . 投 毛 
的 官 始 位 置 . 外 办 条件 等 全 和 弄 准 了 , 则 投 亨 结果 也 就 决定 了 ,因此 
并 无 随机 性 可 言 ., 后 来 大 科学 家 拉 普 拉 斯 也 是 采取 这 种 立场 ,对 这 
个 较 简 单 的 例子 可 以 坦 供 如 下 一 个 解释 :因为 投掷 的 结果 对 有 关 
条 忻 的 依赖 极为 敏感 (条 件 的 极 微小 改变 即 足 以 影响 结果 ) ,而 我 
们 事实 上 无 法 把 全 部 有 关 条 件 养 清楚 ,以 至 指 出 的 结果 事实 上 不 
9 吕 现 少 , 即 有 随机 性 ， 

3. 但 至 乔 引 进 了 所 谓 “ 道 德 确 定性 ”的 概念 (moral certainty). 
一 个 事件 , 虽 不 能 确 然 断定 其 会 发 生 , 但 它 若 被 认为 尽 棚 大 的 可 能 
性 以 至 几乎 不 会 不 发 生 , 就 称 它 有 道德 确定 性 . 简 言 之 . 即 概率 很 

全 按 这 个 意思 ,还 可 也 把 几何 概率 志 括 进 素 ,其 中 等 可 能 的 情况 数 不 是 有 限 的 . 
了 了 


接近 1 的 事件 . 当然 ,要 接近 到 何 种 程度 才 算 有 道德 确定 性 ,没有 
也 无 法 明 指 . 其 反面 , 即 概率 很 接近 0 的 事件 , 自 可 称 为 “道德 否 
定 ” 的 . 这 个 概念 对 后 世 的 数理 统计 学 有 重大 影响 . 在 进行 统计 推 
断 时 ,一 般 我 们 无 法 保证 推断 能 百分之百 地 不 出 错 . 这 时 ,我 们 指 
定 一 个 很 小 的 数 a>0, 面 使 作出 的 推断 出 错 的 概率 不 超过 a. 由 于 
a 很 小 ,一 个 其 概率 不 超过 “ 的 事件 ,在 一 次 试验 中 “道德 确定 地 ” 
不 可 能 发 生 , 因 而 我 们 就 相信 所作 推断 的 可 靠 性 . 以 后 会 指出 一 些 
具体 的 例子 . 现今 我 们 把 伯 努 利 的 道德 确定 性 "叫做 “事实 上 的 确 
定性 "(practical certainty) ,把 “概率 很 小 的 事件 ,在 一 次 试验 中 极 
不 可 能 发 生 " 的 看 法 ,叫做 “小 概率 事件 原理 ”. 我 们 每 天 都 在 运用 
这 个 原理 ;有些 危险 (如 飞机 失事 ) 的 机 会 很 小 ,我 们 就 置 之 不 顾 ， 
当 买 一 张 彩 票 时 ,你 对 中 头 奖 的 可 能 并 不 抱 多 少 希望 

4. 伯 努 利 把 古典 概率 中 * 等 可 能 性 ”的 思想 推广 到 主观 概率 的 
场合 .他 主张 ,如 果 没 有 任何 理由 可 以 认为 众多 可 能 性 中 的 菜 一 个 
或 某 一 些 比 其 他 可 能 性 更 具 优势 时 ,应 给 予 这些 可 能 性 以 同等 的 
主观 概率 . 例如 , 当 我 对 4、B 两 位 横 手 的 棋艺 一 无 所 知 时 ,我 对 


“4 强 于 B” 及 “B 强 于 4A” 这 两 种 情况 同 给 予 主观 概率 十, 当 我 对 


某 个 其 = 毫 无 所 知 但 知道 其 取 值 必 在 区 间 [c,d] 之 内 时 ,我 认为 
取 [Le,djJ 内 任 一 值 有 同等 的 可 能 性 (这 里 ,可 能 性 有 无 穷 多 ) ,部 取 
[ed 内 的 均 名 分布 RCe,q) 为 @ 的 主观 概率 分 布 等 . 后 世 的 学 者 
把 这 个 原则 称 为 “同等 无 知 原则 ” 它 在 数理 统计 史上 有 极 重 要 的 
意 广 .英国 学 者 中 叶 斯 在 1763 年 发 表 的 ,开创 了 统计 学 中 的 见 叶 
斯 学派 的 论文 ( 见 第 三 章 ), 即 基于 这 一 思想 ,虽然 我 们 不 清楚 , 贝 
叶 斯 当时 是 否 了 解 伯 努 利 这 一 著作 . 大 数学 家 拉 普 拉 斯 所 提出 的 
“不 充分 理由 原则 ”, 其 息 想 也 与 此 相同 . 
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§ 1.7 伯 努 利 大 数 定 律 


现在 我 们 来 介绍 伯 努 利 t 推 测 术 } 的 最 和 要 部 分 一 一 包含 了 如 
今 我 们 称 之 为 伯 努 利 大 数 定律 的 第 4 部 分 . 加 到 本 章 开 始 那 个 后 


中 抽 球 的 模型 : 征 中 有 a 白 球 ,5 震 球 ,二 -了 半 %: 有 放 回 地 从 千 中 


抽 球 N 次 ,记录 得 质 到 白 球 的 次 数 为 不 ,以 芳 去 估计 请 这 个 估计 


法 现今 仍 是 数理 统计 学 中 最 基本 的 方法 之 一 . 此 外 的 条 件 是 ,每 次 
朱 取 时 都 要 保证 乍 中 “二 2 个 球 的 每 一 个 有 同等 补 会 被 抽出 . 这 一 
点 在 实 贱 中 并 不 见得 容易 . 例如 ,产生 中 奖 导 码 时 用 了 复杂 的 装 
置 . 在 实际 工作 中 ,统计 学 家 有 时 用 一 种 呀 做 “随机 数 表 ”的 工具 . 
这 是 一 本 大 书 , 各 页 按 行 、 列 排列 着 数字 0,1,….9, 它 们 是 用 据 信 
是 “充分 随机 ”的 方法 产 半 的 .在 使 用 时 ,“ 随 机 地 ” 翻 到 其 中 一 页 
并 ”随机 "点 到 一 个 位 置 .以 其 处 的 数字 决定 抽出 的 对 象 . 


信 努 利 企图 证 明 的 是 :用 芳 估 计 p 可 以 达到 事实 上 的 确定 性 
一 -他 称 为 道德 确定 性 . 其 确切 舍 义 是 :任意 给 定 两 个 数 sc>0 和 


9>0, 总 可 以 取 足 够 大 的 抽取 次 数 N, 使 事件 | | 车 一 | 之 ej 的 概 


率 不 超过 了 这 意思 很 显然 : | 千 一 | >e 表明 估计 误差 未 达到 指 


定 的 接近 程度 s, 但 这 种 情况 发 生 的 可 能 性 可 以 随心 所 向 地 小 5( 代 
价 是 加 六 N), 为 忠实 于 伯 努 利 的 表达 形式 ,应 指出 两 点 ;一 是 伯 
和 舅 利 把 e 限定 为 ta 十 丰 "' ,虽然 其 证 明 对 一 般 e 也 有 效 . 他 作 这 一 


| 


4 陋 今 大 们 并 雹 一 种 可 操作 的 方法 实现 第 对 的 等 可 能 . 故 所 谓 * 随 机 数 " 毅 被 人 
们 称 为 雯 随机 数 或 拟 随机 未 . 
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限定 与 所 用 告 子 模型 的 特殊 性 有 关 : 必 要 时 把 街中 的 白 . 黑 球 分 别 
改 为 ra 和 芭 个 , 则 不 改变 ,C4 十 外 1! 改 为 二 六: 只 须 取 r 足够 


大 ,可 使 此 数 任 意 小 . 其 次 , 伯 努 利 要 证 的 是 :对 任 给 c 守 0, 只 须 抽 


取 次 数 和 N 足够 大 ,可 使 
A 


P| | 各-p | < >cP| 匣 -p|>e]. (8) 
这 三 前 面 所 说 是 一 回 事 . 因为 由 上 式 得 
P| 入 一 / >e] <(c+tD)7, (9) 


取 * 充分 大 可 使 它 小 于 也 另外 要 指出 的 是 : 伯 努 利 使 用 的 这 个 竺 
于 模型 使 被 估计 的 zp 值 只 能 取 有 理 数 ,因而 似乎 有 损 于 其 结果 的 
普 电 性 . 但 其 证 明 对 任意 的 户 成 立 , 故 这 一 细节 并 不 重要 

伯 努 利 上 述 对 事实 上 确定 性 的 数学 理解 , 即 (8) 式 ,有 一 个 很 
值得 赞赏 之 点 , 即 他 在 概率 论 的 发 展 刚 起 步 的 阶段 ,就 给 出 了 问题 
的 一 个 适当 的 提 法 . 因为 ,既然 我 们 想 要 证 明 的 是 当 N 充分 大 时 ， 


谷 和 p 可 以 任意 接近 , 则 一 个 看 来 更 直截了当 的 提 法 是 


2 


而 这 不 可 能 实现 . 因为 原则 上 不 能 排除 “每 次 抽 到 白 球 "的 可 能 性 ， 
这 时 代 总 为 1, 不 能 收 化 于 p<1. 或 者 退 一 步 :要 求 (10) 式 成 立 的 


概率 为 1 ,这 个 结论 是 对 的 ,但 直到 1909 年 才 由 波 芋 尔 证 明 ,其 难 
度 比 伯 努 利 的 提 法 大 得 多 . 设想 如 当时 伯 努 利 就 采用 这 个 提 法 ,他 
也 许 不 一 定 能 在 有 生 之 年 完成 这 一 工作 . 波 莱 尔 的 结论 比 伯 努 利 
还 , 玻 现 今 把 他 们 的 结论 分 别称 为 强大 数 律 和 弱 大 数 律 . 

如 今 具 有 概率 论 初 步 知 识 的 人 都 知道 , 伯 努 利 大 数 律 是 超 引 
厨 夫 不 等 式 的 简单 推论 . 但 在 伯 努 利 时 民 尚 无 方差 概念 ,更 不 用 说 
这 一 不 等 式 了 . 伯 努 利用 的 是 直接 合计 概率 的 方法 ,大 音 如 下 :全 

Avo= P(Np<KX<LNpt Ne), 
20 


| 一 和 


一 五 (MP 二 kNE- Xp 二 (RE 十 1)Ve) 一 1 2，… 
上 只 须 证 上 月: 当 六 充分 天 时 有 ({ 注 3) 
As>et A A )， (11) 


这 就 解 凑 了 和 全 pz 的 一 边 . 对 二 <Ap 的 一 边 如 法 炮制 , 妈 可 得 
出 (8) 式 ， 


附带 指出 :可 以 把 伯 努 利 的 结论 C9) 引伸 一 点 点 :如 果 我 们 知 
壮 佰 中 球 的 忆 数 4 十 5, 或 者 更 广 一 些 , 知 道 a 十 b 不 超过 某 已 知 数 
M; 则 可 以 把 (3) 式 改进 为 :可 以 找到 记 的 一 个 仿 计 多 ( 芝 ) (不 是 
窜 ), 使 当 六 充分 大 时 有 
P(t CNOAEP) T+1}-!, (12) 
但 如 不 给 定 < 二 6 的 界限 , 则 找 不 到 这 样 的 俏 计 量 多 CX)( 注 4). 
伯 努 利 当初 提出 的 目标 , 比 单纯 证 明 (9) 式 要 高 :(9) 式 只 青 定 
了 当 取 N 充分 大 时 ,用 名 情 计 疡 可 达到 任意 指定 的 精度 e, 而 可 千 


度 不 小 于 1 一 te 十 1 1 伯 努 利 希 望 状 清楚 到 底 雷 竖 NN 客 大 .解决 
了 这 个 问题 ,在 实用 上 就 可 以 根据 所 需 的 精度 和 可 靠 度 , 去 规划 所 
须 疯 测 坎 数 Nv. 他 证 骨 了 以 下 的 结果 :定义 


jn 二 不 小 于 jo [ets— 1)) 


g(a 十 1) 一 foga 的 最 小 整数 。 (13) 
"一 不 小 于 To 区 生生 5 的 最 小 整数 ， (14) 
Ni (15) 
Ne : (16) 


则 联 入 二 max (N,N ) 能 满足 (9) 式 . 信 努 利 冶 子 著 干 数字 岗子 ， 
黄 一 为 :a 一 30,5~20(p 一 也 ),e= 直 ,ce 一 1 000. 用 上 述 结果 算出 


所 需 的 次 数 NN 为 25 550. 可 以 与 由 契 比 谢 夫 不 等 式 计 算 的 结果 和 作 
一 比较 . 控 此 不 等 式 , 有 ( 注 5) 


人 2 


> 南 j<| 贡 | N (#5) 


| 3 
P| 5 


为 使 此 值 不 超过 (ec 十 1) :一 一 Ti NN 至少 应 为 600 600, 这 比 伯 努 


利 给 出 的 值 大 20 多 倍 . 这 反映 了 一 个 事实 : 伯 努 利 在 证 明 (9)? 式 中 
所 作 的 概率 佑 值 , 比 根据 契 比 谢 夫 不 等 式 所 作 的 要 精 得 多 . 虽然 
如 此 .25 550 这 个 数 仍 嫌 过 大 . 美国 统计 史学 者 斯 带 枯 勒 认为 , 伯 努 
利之 所 以 久 末 发 布 其 研究 成 果 , 与 他 对 一 点 的 不 满意 有 关 , 因为 在 
伯 努 利 时 代 - 一 个 中 等 城市 的 规模 尚 不 过 开 于 人 ,25 550 简直 可 等 
是 “天 文 数字 ” 不 过 .后 世 的 学 者 所 看 重 的 不 在 这 些 地 方 . 如 今 大 家 
都 公认 ,由 从 努 利 工作 发 端的 太 数 定律 已 成 为 整个 数理 统计 学 的 基 
础 . 人 们 世 对 伯 努 利 工 作 的 哲学 意义 给 予 很 高 的 评价 . 如 斯 蒂 格 勘 
指出 : 伯 努 利 证 明了 数学 家 不 仅 可 以 后 验 地 认识 世界 ,还 可 以 用 数 
学 去 估量 他 们 的 知识 的 限度 . 伯 努 利 在 结束 《推测 术 》 时 就 其 结果 的 
意义 作 了 如 下 的 表述 :如 果 我 们 能 把 一 切 事件 永恒 地 观察 下 去 , 则 
我 们 终 将 发 现 : 世 间 的 一 切 事物 都 受到 因果 律 的 支配 ,而 我 们 也 注 
定 会 在 种 种 极其 纷 疆 杂 乱 的 事 象 中 认识 到 某 种 必然 . 

关于 决定 最 小 N 的 问题 ,一 些 与 伯 努 利 同 时 或 各 后 的 学 者 也 
研究 过 . 例如 伯 努 和 的 侣 儿 尼 科 拉 斯 在 1713 年 给 一 位 友人 的 信件 
中 报告 了 他 得 出 的 一 个 有 美 结果 , 比 怕 努 利 的 上 述 结果 有 所 改善 . 
如 对 但 舅 利 的 例子 ;用 尼 科 拉 斯 的 公式 佑 出 所 需 入 为 17 350. 稍 


后 到 1733 年 , 狄 莫 暮 发展 了 用 正 态 分 布 逼 近 二 项 分 布 的 方法 (更 


第 二 章 ) ,这 是 一 个 实质 性 的 .意义 深远 的 改进 . 按 此 法 人 秸 出 的 入 
约 为 6 600: 这 已 是 没有 改进 余地 的 了 . 6 600 这 个 数字 仍然 很 大 ， 
它 显 示 , 里 然 自然 界 的 奥秘 可 通过 实验 观察 发 现 , 但 自然 界 并 不 轻 
甸 就 露出 自己 的 真面目 .这 个 例子 也 提醒 我 们 :在 报章 杂志 等 中 不 
时 亲 以 看 到 的 .根据 一 小 批 样本 而 计算 出 的 某 种 特征 的 个 体 的 比 
率 , 作 为 样本 来 自 的 大 群体 中 该 特征 所 占 比 率 的 千 值 ,其 准确 度 和 
可 靠 性 ,通常 远 小 于 没有 受过 统计 学 训练 的 公众 所 认为 的 程度 . 
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注 1: (3), 4) 两 式 等 从 的 证 明 . 
把 2 "i 写 为 2 2 4) 式 化 为 


etrisrad 2 Ms OCaH 2 
此 式 与 43)? 式 比较 者 出 :只 须 证 明 


r-y- 1 


rz 一 1 


Sn Sn gr (A1) 


此 式 当 记 二 ] 时 戌 空 . 用 归纳 法 ， 假定 (Ai 在 六 扫 上 有 时 成 立 . 在 
(A 态 1) 丰 边 令 y= 二 上 十 1. 因为 


Citis~Ontil tO 1!, 


是 


3 
Cnt = 之 CU 二 cn Lk- 1 
— Swe Se 
上 一 蜗 + 二 让 


上 一 
Ca 十 2 人 CT 
对 后 一 和 用 归纳 假设 ,由 (A1) 得 
- 上 


上 由 一 ] 下 
DJ Cth t+ 上 上 --] 十 2 Cm! HADttr — Dlrigtt 
f 一 包 1 ar 性 Ff 说 

证 明了 (Al 在 7; 二 十 ] 也 成 立 . 


注 2:17) 式 的 证 明 . 
以 关怀 记 在 4 已 胜 : 局 .有 已 胜局 的 情况 下 ,4 最 煞 获 用 
的 概率 . 财 我 们 要 求 的 就 是 由 0,0). 按 规定 ,有 
htis)) =1, 当 74,1— jj 让 2; 
htt =0, 714,12 
HCD.2) =h(3,3)==.-. 


假定 再 周一 局 . 若 4 用 (概率 pp} ,情况 变 为 人 二 1， 站. 若 辣 胜 
‘概率 g) ,情况 变 为 人 7 十 1). 页 按 全 概 守 公式 ,有 
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hs = phG+1,7) qh,i+1). 
令 1 一 7 二 3, 得 月 (3,3)= 二 ph(413) 十 qh(3,4). 分 别 在 上 式 中 令 羽 ， 
门 二 (4;3) 及 (3,4) ,得 上 (4,3) 和 (3,4) 的 表达 式 ; 代 入 上 式 得 

h(t3.3)— ph(5,3)+2paqhtd .4)+ oh(3,5) 

~ p+2pqght313). 
于 是 得 
2 

h(3,3) = 7 ei 
再 在 式 中 令 {, 站 二 {2,3), 得 


pr 大 
C2,3)= ph(3,3) +oh(2,4) = 注意 到 一 人 一 ， 


2 


h(2,3) = 3 
舌 此 以 往 , 依 次 得 有 (03,2) 522) ,3 1》 天 (1 3),-…,， 直 至 凡 (0， 
0), 陈 是 (1) 式 . 

这 个 他 题 可 以 推广 为 :一方 胜 局 达到 mm 且 比 对 方 的 胜局 儿 区 ， 
浊 此 方 获胜 . (1) 式 对 应 于 mr 二 4,n 二 2 的 情况 .一般 情 况 原 则 上 也 
可 用 上 述 步 野 求 解 ,但 对 大 的 mm 和 和 公式 将 繁杂 得 难以 想像 . 例 
旭 乒 玉 丈 相当 于 到 一 21 和 闫 一 2. 


注 3:(!11)? 式 的 证 明 . 

我 们 先 介 绍 一 个 证 明 ,其 思想 与 伯 努 利 的 原始 证 明 一 致 ,但 形 
式 路 广 一 些 , 然 后 指出 伯 努 利 原 始 证 明 差 异 之 处 .我 们 只 点 骨 主 要 
的 步骤 ,一 些 容易 的 细节 请 读者 自己 补 出 ， 

1. 先 证 明 存 在 常数 xf( 与 各 无关), 使 


A w= 0,l12,. {A 站) 
夺 此 式 已 证 : 则 有 4 一 坟 4, 故 
怠 | 十 夺 二 w(t 一 uw} 和， {AAA3) 


2 


六 证 AA2), 记 bi— Np kiNs 1. 控 - 由， 的 定 党 ， 在 
Ph 二 Ne]) 
A PX=b)+ POX=6TD) TPOX=D 二 + Ne—1) 

Smax [PREb0,..., PX hrs Ne 1) 

= PIR=6)Y  * POX=b Ne—1) / 
此 处 有 一 个 如 可 以 不 是 整数 的 向 题 . 这 需要 在 写法 上 上 作 一 点 小 的 
调整 . 以 下 为 行文 商 单 , 略 去 这 一 调整 ,这 与 实质 无 损 ( 在 怕 努 利 的 


原始 证 明 中 ,pp 一 了 45， 一 = 二 5 而 他 取 N 为 < 二 6 的 整 倍数 , 故 这 


时 br 米 为 整数 :不 存在 十 述 问题 }. 
容易 证 有 明 ;: 当 rs 而 /全 0 时 , 丰 


PlXE=s) (人 二 5 二 7) 
PXS=r)” POr+A) 


当然 这 里 要 求 + 实 0 而 s 十 ! 气 N., 上 式 易 由 二 项 概率 公式 证 明 
之 . 由 以 土 两 式 得 


-i 1 (= 0 1) 
A PiX=—b,) PlX=Bb) 
而 上 与 大 无 关 ， 


2. 证 明 当 N->oo 时 ,w-*0. 车 此 已 证 ,; 则 由 ( 态 3) 立 即 得 到 (5). 
按 二 项 概率 公式 有 (9 二 1 一 户 ); 
gi™ 
4 


NpH2 CNp+ 3 (Np+ Net1) | 
(Ng— Ne}(Ng— Ne Du (Ng—1) 
i 


_IT Mtiti -IT 一 全 
i=1 Ng lp ‘=1 paip 
~ 


ME mt 
(1 1}. tl1) 
>1l{it+ > 这 Rr 


pe IY 


J 
于 是 证 明了 w 一 0. 


一 和 站 MN oD. 
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C11) 式 证 上 毕 . 
Ee 和 及 NN 无 所 限制 .在 伯 努 利 的 原始 证 明 中 ， 


,而 N 是 (a 十 6) 的 整 信 数 . 这 时 不 仅 不 存在 上 还 
bi 可 能 不 为 整数 的 困难 , 且 在 去 挤 公 因子 (a 十 6)-* 之 后 ,可 以 用 
整数 | “| ab" 代替 P(X= 让 ,处 理 较 方便 ,但 步 驰 和 证 明 的 实质 
部 分 无 所 差异 ， 


PT ate 一 


注 4: 满 足 C12) 式 的 方 (X) 不 存在 的 证 明 . 
固定 一 个 目 然 数 六 . 取 整 数 ” 充 分 大 ,使 rfa 十 区 人 > 六. 乍 中 有 
白 球 ra 个 , 黑 妹 到 个 ,对 此 咎 ,在 不 知道 白 . 黑 球 个 数 的 情况 下 ， 
自 球 个 数 可 能 取 0,1,… ,ra 十 6) 等 值 , 放 值 | 主 熙 数 ] 有 (Ca 二 
上 十 1 个 可 能 值 ; 分 别 记 为 pls pur 二 rta 二 5) 十 1, 取 之 MM. 
大 户 ( 芝 ) 满 足 {12);, 垃 有 
PL P(X)= p>0, 
此 处 PP, 表示 ;概率 是 在 白 球 比 率 为 p, 时 计算 的 , 由 此 式 知 ,集合 
D={j!: j=0,1 ,Ns;: B07))=p,) 
非 空 , 妈 它 鞭 少 有 一 元 ;因为 Di,-… ;Dyw_1 这 MM 一 1 个 集 两 两 无 公 
共 后 * 故 其 并 圣 少 有 本 一 1 蒂 六 十 1 元 ,这 推出 集 Dy 必 为 空 集 , 因 
而 
PL P(X)= pyl=0, 
与 (12) 式 矛盾 . 这 证 明了 久 ( 芝 ) 的 不 存在 性 . 


注 5: 关 于 伯 努 利 的 结果 与 用 契 比 谢 夫 不 等 式 得 出 的 结果 的 
比较 ,还 应 注意 几 点 :其 一 是 佳 努 利 的 结果 只 适用 于 e 一 一 工 六 的 


俏 汽 ,而 契 比 谢 夫 不 等 式 中 的 。 无 所 限制 . 更 重要 的 是 , 伯 努 利 是 
26 


在 一 二 < 已 知 的 前 提 下 去 算 的 ,而 p( 即 a, 此 处 假定 a 十 b 是 图 


定 且 已 疹 的) 其 实 末 向. 这 样 一 来 , 当 求 N) 时 ,应 缚 合 (137.(15) 
并 式 ,把 I 表 为 忆 的 旺 数 (再 说 一 让 让 -二 站 已 惹 }》 ,然后 对 0,1， 


十 上 ) 求 极 太 值 作 汐 和 N,N: 则 通过 类 似 处 理由 (14)、(16) 黄 
式 导 出 , 这 样 一 来 ,所 定 出 的 入 可 能 会 有 较 太 幅 六 的 增加 . 


对 疤 比 谢 夫 不 等 式 当然 也 有 类 似 问题 , 俱 情 况 简单 得 多 , 因 方 
差 在 p== 广 时 达到 最 大 ,只 须 按 一 六 计算 方差 即 可 . 作 了 这 样 处 
理 后 , 按 契 比 谢 夫 不 等 式 所 算出 的 六 由 600 600 增 为 625 625. 


2 


第 二 章 狱 莫 弗 的 
二 项 概率 通 近 


设 某 事 件 4 的 概率 p 未 知 .在 同样 条 件 下 独立 地 进行 和 N 次 
试验 或 观察 (“同样 条 件 ” 一 语意 味 着 ,事件 4 出 现 的 概率 疡 在 各 


次 试验 中 保持 不 变 ) ,发现 事件 4 发 生 XX 次 ,等 称 为 事件 4( 在 这 
N 次 试验 中 ) 的 频率 . 用 我 们 现在 的 语言 来 说 , 伯 努 利 在 其 划时代 
的 著作 《推测 术 ) 中 证 明了 : 当 N-~<o 时 频率 芒 依 概率 收 敏 于 z. 伯 
努 利 并 试图 解决 如 下 的 问题 :给 定 >0 和 ce>0te 很 小 而 < 很 大 )， 
为 使 事件 | 药 一 | <<e 的 概率 不 小 于 区 全 1 ,试验 次 数 N 至 少 须 


达到 多 少 , 介 努 利 担 殿 的 答案 不 局 令 人 满意 ,与 此 同时 , 伯 努 利 的 
任 儿 若 * 推 测 术 3 的 定稿 人 尼 科 拉 斯 也 提供 了 一 个 管 案 . 记 
P=P(KX— Np|ASAd). 《1 ) 
尼 科 拉 期 的 做 法 是 固定 N 去 估计 Pi; 而 不 是 从 设 定 的 对 Ps 和 值 轰 
求 出 发 去 估计 .地 得 到 公式 : 
Pel —max(ta vb), 


其 中 ， 


| EN 一声 ) 一 家 十 1 六: | 
TCD 


(Np—dl)N(I— pp) : 
CNC— pp} ATs 


站 
5 一 | 
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为 要 使 Ps 之 了, 则 必须 找 最 小 的 使 满足 


as fc 十 1) sfec 十 1》 
上 章 结 尾 处 曾 就 一 个 具体 例子 指出 , 尼 科 拉 期 的 铮 轻 之 候 努 利 的 
解 ,有 相当 的 改进 . 注意 a 及 上 的 计算 依 现 于 户 , 而 在 实际 问题 中 了 
来 知 , 上 述 比 较 是 将 p 作为 已 知 代 入 算得 ,因此 还 不 能 算是 圆满 . 


实际 中 为 计算 a.6 的 一 个 方法 是 用 千代 替 p, 但 所 造成 的 误差 不 
好 佑 计 . 另 一 个 作法 是 设法 证 明 ;(1) 式 定义 的 Ps 作为 的 函数 ， 
在 p 二 方 时 达到 最 小 . 因此 只 须 对 p 二 过 的 情况 去 好 理 这 个 问题 ， 


尼 科 拉 斯 的 解 昌 多 少 有 所 改进 ,但 仍 失 之 粗 烟 . 究 其 原因 ,PP 
是 一 些 二 项 概率 之 和 和 ,在 当时 的 条 件 下 ;上 后 乏 有 效 的 处 理 这 种 各 的 
方法 . 而 独 葛 强 则 是 从 慷 计 单个 的 二 项 概率 入 手 , 取 得 了 本 质 性 的 
突破 , 他 的 成 就 对 后 老 有 极 大 的 影响 ,值得 我 们 辟 出 一 章 来 叙述 他 
的 发 现 的 历史 ， 


8 2.1 狄 黄 弗 的 研究 的 动因 


亚伯拉罕 ， 犹 磺 弗 出 生 在 法 国 一 个 新 教徒 的 家 中 . 19 岁 那 年 
曾 因 宗教 信 仙 的 原因 被 捕 入 狱 , 度 过 了 2 年 的 铁窗 生涯 . 为 躲避 这 
种 这 害 ,他 于 21 步 时 流亡 到 伦敦 ,担任 一 名 教师 . 在 那里 ,他 在 教 
书生 证 之 余 继 续 研 习 数 学 ,主要 是 阅读 凯 出 版 不 久 的 牛顿 的 著作 
《上 量 然 哲学 的 数学 原理 》 他 在 数学 领域 内 到 得 了 多 方 而 的 成 就 ,这 
叶 到 候 在 169? 年 当选 为 黄 国 皇家 学 会 会 员 ,这 年 他 刚 届 而 立 . 他 
的 一 项 广为人知 的 成 果 , 是 著名 的 狄 莫 弗 公式 

cos tisind)"  —cosnd isinngd. 
《但 狼人 莫 弗 疫 有 把 他 的 公式 写成 这 个 形式 )， 
有 49 


在 1718 年 , 犹 莫 弗 叶 版 了 机 和 明 论 Doctrine of Chances?) 一 
书 , 此 书 莫 定 了 和 他 在 概率 史上 前 地 位 .该 省 一 共 出 了 三 版 ,分 别 在 
1718,.1738 利 1756 年 . 人 们 常 说 ; 较 早 期 的 概率 中 上 有 三 部 里 程 
碑 性 质 的 著作 , 狄 莫 惠 的 * 机 过 论 } 即 为 其 一 . 务 两 部 是 伯 努 利 的 
《推测 术 》 及 拉 普 拉 斯 在 1812 年 出 版 的 《概率 的 分 析 理 论 》。 

有 趣 的 有 是 ,吸引 狄 莫 弗 投 身 到 二 项 概率 的 研究 的 契机 , 侄 不 是 
伯 努 利 的 工作 .事实 上 ,1718 年 版 的 机遇 论 》 一 书 裘 明 , 狄 氏 对 但 
努 利 的 工作 颇 有 一 些 看 法 . 狄 莫 弗 之 所 以 注意 到 这 个 问题 ,与 下 述 
便 然 情况 有 关 . 

1721 年 ,有 一 个 省 叫 亚历山大 ， 喀 明 芍 大 向 狄 氏 提出 一 个 问 
题 :4. 呈 二 人 在 某 围 家 赌博 , 每 局 4 获胜 的 概率 为 pp,B 著 胜 的 概 
率 为 yg 二 1 一 志 赌 N 局 ,以 了 荆 记 有 丰 胜 局 数 , 约定 :知人 苹 守 Np; 则 有 4 
付 给 申 站 一 和 Np 元 ;车 着 之 Np ,这 时 和 NW 一 五 记 Ng; 则 B 村 给 甲 (NN 
一 区 ) 一 Ng 一 Np 一 六 元 , 问 甲 所 得 的 期 望 值 是 多 少 ? 按 定义 ;此 期 
望 值 为 


Dy = E(|X— Np|) = > — Np]bCON,p,i), 


这 里 PEN, 户 ,站 汐 二 项 概率 CYp(1 一 pI 犹 莫 弗 在 Np 为 整数 
的 条 忻 下 得 到 
Dv=2NPp9b(N ,ps Np), C2) 


且 他 只 对 p 二 直 的 特例 给 出 证 明 . 不 过 ,其 证 法 易 推 广 到 一 般 的 


户 . 犹 氏 声称 此 公式 他 在 1721 年 得 到 ,但 证 明 首 次 发 表 是 在 1730 
年 . 现在 我 们 容易 在 一 般 情况 下 证 明 ( 注 1) 
Dy—2ggb(N , prep) ,i= [Np 二 1. (3) 
此 处 及 以 下 ,Lej 表 不 超过 = 的 最 大 整数 , 易 验 证 ; 当 Np 为 刺 数 
时 ,公式 2713) 一 致 . 
上 述 公 式 问 管 了 昱 有 明 提 出 的 问题 ,但 在 入 较 太 时 ,2CN, psi) 
的 计算 不 易 ,因此 犹 莫 弗 想 找 到 一 个 醒 于 计算 的 近似 公式 . 在 放 述 
30 


他 对 这 个 问题 的 研究 之 前 , 先 就 上 述 会 式 作 一 总 讨论 . 记 
A 碟 了 
Kw |N-2| 一 宫 
则 由 (2) 式 有 下 nw 二 2pgbtN pmp 容易 证 朋 ( 注 4) 
这 个 证 明 可 以 于 初等 方法 得 天 ,而 不 必 利 用 当时 尚 不 知道 的 斯 特 


天 公式 ( 广 2). 由 此 得 出 lim 不 二 0. 再 由 P| 入 一 p| > Ee” 


Kw, 即 得 lmP| | 等 一 | 之 e] =0, 这 就 是 伯 努 利 的 大 数 定律 .这 


个 证 法 当然 与 用 契 比 谢 夫 不 等 式 的 证 法 基本 一 致 ,但 要 记 住 当时 
尚 无 方差 这 个 概念 . 其 次 , 铬 莫 弗 后 来 证 明了 当 N-=co 峙 ,6CVyp， 


z) 是 以 一 二 的 速度 趋 于 0. 困 此 开 v 也 是 灸 同一 速度 趋 于 0. 这 


可 以 解释 为 :频率 车 估计 概率 户 的 精度 ,大 致 上 是 与 试验 次 数 N 


的 半 方 根 成 比例 ,而 非 初 看 起 来 可 能 以 为 的 那样 与 入 本 身 成 比 
例 . 后面 我 们 还 要 回 到 这 个 重要 癌 题 . 


3 2.2 犹 莫 弗 的 初步 结果 


多 英 弗 首先 假定 N 为 偶数 2m, 概 率 2 一 土 , 来 研究 中 心 项 


bC2m sm) 然后 再 研究 中 心 项 与 一 个 任意 项 之 比 ， np 
[此 处 已 简 记 BO) =6(2m, 二 5 1)2. 犹 莫 弗 在 1721 年 得 到 下 述 结 
梁 ; 当 一 co 有 时， 


$1 


(1 一 地) 


一] 


， (5) 


五 (六 


ptm)y | 1 
log| pmo 一 | 加 十 7 |log (za 十 da 1 》 


| 
Hi 


十 | 产 一 4 二 到 |logCGm 一 TD 一 2mlogm 十 log| .£6) 


苇 们 把 狭 葛 弗 的 原始 证 明 放 到 章 末 的 注 记 中 ,以 备 维 这 一 段 史实 
感 兴趣 的 读者 参看 .对 于 只 对 史实 的 极 概 感 兴趣 而 不 追求 数学 细 
入 的 读者 ,可 以 略 去 这 些 . 这 还 因为 ,有 的 细节 如 今 已 没有 多 少 现 
洋芋 六- 例如,.5) 式 在 当 今 的 教科 书 上 己 根 本 看 不 到 . 即 在 狱 莫 弗 
当时 ,(5) 式 对 他 在 这 方面 的 进一步 研究 也 未 起 多 少 作 用 ,但 其 证 
法 则 有 其 重要 性 . 另外 还 要 指出 ,(6) 式 的 成 立 对 dd( 可 随和 N 变化 ) 
有 一 定 的 限制 ,这 一 点 狭 莫 弗 没 有 明确 指出 . 琶 在 利用 斯 特 灵 公式 


不 难得 出 应 限制 等 一 0. 不 过 , 狂 氏 在 利用 这 个 公式 作 进 一 步 的 论 
证 时 ,并 未 违背 这 个 限制 


3 2. 3 初步 结果 的 改进 .与 斯 特 灵 的 联系 


451 《6 两 了 式 解 决 了 喀 明 握 出 的 问题 (对 一 般 户 的 结果 类 亿 ， 
拖 后 ), 但 还 不 能 用 于 更 重要 的 目的 一 一 给 由 (1)? 式 定 必 的 尸 . 找 
出 一 企 近 他 会 式 , 而 后 者 ,后 来 的 事实 证 明 ,是 犹 葛 弗 的 工作 对 后 
世 发 挥 主要 影响 的 部 分 . 这 方面 进展 的 下 一 步 推动 力 来 自 斯 特 灵 
(James Stirling ;1692- 一 1770). 他 在 数学 上 以 其 甘于 夫 科 的 亲近 
公式 而 知名 . 原来 在 1725 年 , 喀 明 把 犹 黄 弗 的 结果 告知 了 斯 特 灵 ， 
这 激 起 了 后 者 的 兴趣 ,他 因 之 作出 了 关于 57y 的 凑 个 玻 数 娄 
达 云 : 
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pm 2 lt + 了 5 
2 二 1) 4 隐士) 32Gm 十 了 (7 十字 ) 


(7) 


pCm) mm| 1+ 十 


1 9 
4Cm+1) I mt +") (8) 
其 证 明 极 为 繁复 ,此 处 不 细 述 . 值得 注意 的 是 ,这 是 了 这 个 符号 首 


次 被 引进 到 这 类 公式 中 来 9. 特别 地 ,注意 到 mm 一休, 令 N 一 co 在 
(8) 式 右边 只 取 主 项 1, 即 得 到 下 面 的 重要 结果 : 


2 
Dm) A FR: {92 


这 个 娃 果 的 意 兴 很 重大 . 因为 ,057? 式 中 的 一 只 表示 两 过 接近 的 总 
是 ,不 含有 当 六 一 时 现 边 比值 趋 于 1 的 结论 ‘这 不 难 从 形式 上 看 
出 ,因为 2.168 这 个 数 显然 是 近似 计算 的 辣 果 .而 非 取 极限 所 得 )， 
面 569) 式 所 指 则 正 是 这 个 结论 . 设想 独 莫 弗 迟 留 在 565? 式 上 , 则 尽管 


由 此 可 形式 上 得 到 plm) ~ 一 ,但 此 式 与 下 文 (13) 式 结合 ， 


只 能 得 到 (15) 式 积分 前 的 常数 因子 为 二 一 0， 3987813 .而 非 正 


确 值 -天 = 一 人 3989422. 这 个 差别 虽 则 以 数值 计算 的 观点 看 也 许 


不 重要 ,但 终究 不 是 标准 正 态 密度 . 男 一 方面 ;对 较 小 的 和 N,(5) 式 
的 近 航 程度 略 优 于 (9) 式 .例如 和 =6 时 .” 

pt3) 正确 值 : 03125000 (5) 式 ; 0. 325 603 5; (9) 式 : 
0.325 7350, 而 一 12 时 以 上 3 值 分 困 为 口 2255859， 
0.230 236 5 和 0.230 329 4. 在 入 = 一 18 时 (5) 仍 赂 优 子 <9). 

所 位 的 是 独 莫 弗 与 斯 特 灵 有 联系 ,后 者 把 其 结果 通知 了 前 者 . 


中 这 一 艘 史实 显示 ;在 二 现 分 布 的 正 态 通 近 这 一 重要 论题 中 ,也 有 斯 特 灵 的 一 分 
草 劳 .得 如 今 教科 书 中 老 把 这 一 感 果 全 归于 狭 莫 翡 . 


要 


很 局 狂 葛 弗 发 更 ,重要 结果 49)? 可 以 通过 应 用 瓦 里 斯 在 1655 年 得 
到 的 下 述 匹 穷 乘积 结果 


2 
Ai AH FT 1*3.5*. * (oN—1) 一 /到 4191 


而 很 容易 得 出 ,这 只 人 须 注 意 
pln) = > > Es" 人 Dy 

从 狄 昔 弗 得 到 (9} 式 的 时 间 上 看 ,认为 他 之 注意 到 鞭 间 题 与 天 
里 斯 会 式 的 关系 是 出 于 斯 特 灵 结果 的 促进 ,大 概 是 不 错 的 . 若是 狄 
英 需 能 更 早 注意 到 其 问题 与 玖 里 斯 公式 的 关系 , 则 他 可 以 更 早 得 

公式 (9) 从 而 更 早 地 完成 整个 研究 . 这 也 可 以 梧 他 省 赂 推导 不 起 

作用 的 公式 (5}) 的 麻 烦 . 

斯 特 灵 公式 最 初 发 表 于 1730 年 .斯 特 灵 在 当年 作出 了 一 个 年 
一 般 的 结果 ,其 著名 的 阶乘 公式 则 是 其 一 个 推论 , 1730 年 狂 葛 弗 
证 明了 以 下 比较 简洁 的 形式 (斯 特 灵 原来 的 形式 比 这 复杂 )， 


jn! = Varm" tlexp| —m+ 1 — 506dt ， 《1) 


玫 去 后面 那个 随 六 一 2 而 趟 于 6 的 部 分 ,得 到 教科 书 上 常见 的 
形式 
ml ~ DA "~ Te ‘12 


3 2.4 积分 形式 ，P, 的 近似 公式 


以 上 驶 是 1730 年 时 的 情况 ,更 重要 的 对 PP 的 公式 ,还 得 等 待 
3 年 以 后 . 现在 看 来 ; 狄 英 弗 是 受 了 (6) 式 “过 于 精确 "之 累 , 因 为 它 
舍 有 一 些 高 阶 项 ,内 而 不 利于 转化 为 一 个 形式 简单 的 被 积 函 数 . 到 
1733 年 ,他 走出 了 具有 决定 意义 的 一 步 ,证 明了 当 N->co 时 有 
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pimt ad) cz 
人 exp| |. (13) 


符 号 一 的 意义 是 两 边 的 比 趋 于 1. 从 {3) 式 的 证 朋 ( 昂 注 3) 可 以 看 


出 ;在 4 可 随 N 变化 但 -5 保持 有 办 时 ,13) 式 当 ->co 时 对 这 


样 的 4 一致 成 立 . 把 (9 与 4132 结 合 , 得 


2 于 
上 十 也] 一- 而 《二 》 
™ OR 


利用 (14) ,并 这个 地 以 定 积 分 代 营 和 ,得 


本 . 2 -0 : 
Pi= De bi ~ pe | 
2 证 1 2 
VR or “和 二 
~ 一 一 e dr 一 一 -一 7 Id. (15) 
7 专 上 3 了 


但 狭 莫 砷 给 出 的 不 是 (15) ,而 是 其 单 边 形 式 


. 1 We 
> er bf) ~ | -3drz, 
?sc Ml rm -1 pu | 27 2 


这 里 一 cc C00 yc 4c 有 并 但 可 与 TV 有 天. 
给 定 c 全 0. 在 (153? 式 中 令 eg=ce vv ,得 


和 1 C | 2 
P. 人 =P| 坟 - 二 |<- 全 ~ 中， {17 


(16} 


拉 普 拉 斯 在 1774 年 证 明了 


一 


由 此 趟 及 (177 可 知 若 可 <c 充 分 大 , 则 对 足够 天 的 六 , 事 性 
x 1 


TT 


© . 人 

稚 出 对 任 给 > 0, 有 lim 了 P| | 党 一 去 |<<e] = 1, 即 伯 努 利 大 数 
现在 我 们 冲 把 (15) 式 (或 更 一 般 的 形式 165) 式 ) 叫 巩 狄 莫 弗 中 
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心 授 限定 理 .可 以 说 直到 20 措 纪 30 年 代 初 为 小 ,独立 变量 和 的 中 
心 极限 定理 的 研究 在 概率 论 中 鼎 据 了 中 心地 位 ,而 这 个 主题 凤 以 
犹 葛 强 在 1733 年 的 工作 发 其 端 . 中 心 极 限定 理 在 数理 统计 学 中 的 
重要 作用 也 是 众所周知 . 由 此 看 ,说 独 莫 弗 的 工作 是 数理 统计 学 发 
展 史 上 的 一 块 里 程 碑 ,也 不 算 过 分 . 


上 而 讨论 的 是 对 称 ( 即 pz 二 二) 的 情况 . 狄 莫 弗 也 给 出 了 对 任 
意 上 的 结果 : 
aotN pNP {2arN pa) Fexp 去 所 | (18) 


此 好 y= 二 1 一 pl( 当 Np 非 整 数 时 ,Np 十 4 下 汶 CNp] 十 2). 奇怪 的 
是 ,他 没有 给 出 对 应 的 积分 形式 的 公式 , 即 


.中 
fa 一 2,,. nea tsp) 人 - 寺 ， ed (19) 
或 更 一 般 的 形式 
ay 
3 | 一 
> was ON ,pi) z= at 二 dz 《20) 


当然 ,由 (197 推 出 (20)? 的 方法 ,与 由 (14) 推 出 (15) 完 全 一 样 . 也 许 
由 于 这 一 点 ,他 就 没有 把 (519) 或 (20) 明 显 地 写 出 来 . 

作为 对 由 (1) 式 定 文 的 P 的 中 近 , 狱 英 弗 的 结果 优 于 伯 努 利 
及 尼 科 拉 斯 的 结果 ,这 可 以 用 两 种 方法 来 比较 . 记 住 我 们 的 了 向 题 是 


找 出 ,使 Pu i 一 种 比较 的 方法 是 固定 ww 和 < 来 比较 w， 
d 小 者 为 优 …. 有 一 组 涉及 生男 孩 概率 问题 的 实际 数据 ,其 N= 
14 000, 0713=0 954, 调 户 一 0.514 3, @ 值 分 别 为 ， 


站 从 严格 的 数学 意义 上 看 这 里 还 存在 一 个 问题 , 即 在 固定 。 时 ,概率 
人 _- . 
(| 7 地 | 六 9 不 一 定 随 w 增加 而 非 降 , 视 N=3,p 二 计 ,5 二 证 的 例 可 知 .但 在 入 和 
大 时 ,这 个 现象 从 实用 的 观点 看 并 不 重要 
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人 图 利 ;0.021 0a; 尼 科技 斯 ;0.010 4ai 狼 莫 旨 :0.008 4a 其 
中 a 二 vw Npg= wv L4000(0. 5143)(1—0.5143)=59.136 台 . 


另 一 种 方法 是 固定 乞 9 和 < 来 比较 N, 这 更 符合 最 初 的 意 轧 . 


使 用 在 上 一 章 中 用 过 的 例子 ,其 p= 二 0.6,c 二 1 000 而 等 一 0. 02. 用 


伯 努 利和 科 尼 科 拉 斯 方法 所 得 的 和 N 信 已 在 上 章 末 尾 指 出 ， 曾 用 犹 英 
弗 逼 近 所 得 的 加 芍 为 6 6800. 


狄 莫 弗 也 考虑 了 积分 | 。 到 dz 的 数值 计算 问题 .对 较 小 的 a 


他 把 函数 e- 亏 展 为 寨 级 数 , 逐 项 积分 算 其 有 限 项 之 和 . 对 较 大 的 
a, 他 在 区 间 [ 记 ,a] 内 用 二 次 多 项 式 近 似 代 将 e- 开 .结果 表明 , 当 a 


较 小 时 效果 甚 佳 ,而 a 较 大 时 仍 可 以 .例如 ,对 4 二- 福 ,pp 二 去 , 按 
《152 我 有 
] 于 
一 oe 3 dz. 
2A 一 1 


按 犹 莫 弗 的 近似 算法 得 户 s 的 近似 值 为 0. 682 688 ,而 Pi 的 精确 
到 6 位 之 值 为 0.682 689. 对 较 大 的 a， 

4d 二 VN : 狄 莫 弗 近 似 0.954 28, 确 值 0. 954 50， 
3 人 


过 一 : 狼 莫 不 近似 0.998 74, 铺 值 癌 .997 30. 


以 现代 的 计算 工具 ,不 难 把 | ce- 号 dz 这 样 的 积分 计算 到 所 需 的 位 


数 . 因此 ,我 们 关心 的 问题 是 概率 Ps 与 积分 的 差距 . 旧 前 已 知 , 即 
使 NN 小 到 30 在 右 , 只 要 疡 不 太 接 近 .0 或 1， 浆 近 的 精度 从 实用 的 


了 因为 事件 {|X 一 Npl<d)~ 人 | 若 ~p| 志 各 ,国定 甸 即 国定 了 对 频率 和 要 
齐 的 差 下 的 要 咸 ，、 +， 


FF 


观点 看 是 满意 的 . 狄 莫 弗 日 马 也 考虑 过 这 个 癌 题 . 他 说 “经 过 试 算 
证 实在 六 为 100 左 右 仍 属 满意 . 这 大 概 是 指 通过 己 算 (用 二 项 
分 布 精确 计算 已 ,并 把 积分 算 到 很 准确 ). 在 没有 电子 计算 机 的 当 
时 ,这 实在 是 一 个 令 人 人 望 而 生 民 的 任务 . 


人 2.5 犹 莫 弗 工作 统计 意义 的 讨论 


公式 (17) 说 有 明了 ;就 “用 频率 估计 概率 ”这 个 特例 而 言 , 观 察 值 
的 算术 平均 (在 此 例 即 频率 ) 的 精度 ,与 观察 次 数 入 的 平方 根 Y 褒 
成 比例 "这 汝 清 了 一 个 当时 在 学 者 中 有 分 野 芍 问题 ;有 的 学 者 认 
为 取 平 均 其 效果 不 必 优 于 从 那 批 数据 中 挑选 出 的 质量 最 好 的 一 
个 , 另 一 个 极端 则 是 认为 平均 值 的 精度 应 正比 于 N, 独 黄 弗 以 数 


子 的 精确 性 肯定 了 真相 是 介 于 二 者 之 间 , 即 精度 正比 于 v 交 ,这 
可 以 看 作 是 人 类 认识 自然 的 一 个 重大 进展 . 狄 莫 弗 也 因 之 看 出 了 


wv AN 这 个 量 的 特殊 地 拉 , 他 为 此 特别 引进 了 “ 模 *(modulu) 这 个 称 
呼 . 这 个 概念 后 来 没有 能 探 存 下 来 ,而 被 现时 常用 的 概念 标准 差 所 
取代 了 了 . 

狂 莫 弗 的 工作 对 数理 统计 学 最 大 的 影响 ,当然 还 在 于 现今 以 
他 的 名 字 命 名 的 中 心 极限 定理 . 狄 莫 弗 作 出 他 揭发 现 后 欧 40 年 ， 
拉 普 拉 斯 建立 了 中 心 极 眼 定 理 较 一 般 的 形式 ,独立 和 中 心 极 限定 
理 最 一 般 的 形式 到 20 世纪 30 年 代 才 最 后 完成 . 硕 后 统计 学 家 发 
再 ,一 系列 的 重要 统计 量 ,在 样本 量 N 一 co 时 ， 其 极限 分 布 都 有 正 
态 的 形式 ， 这 构成 了 数理 统计 学 中 大 样本 方法 的 基础 . 如 今 ， 大 样 
本 方法 在 统计 方法 中 占据 了 很 重要 的 地 位 ， 饮水 思 漂 ， 狄 莫 弗 的 工 
必 林 以 沈 古 这 一 重要 发 展 的 源头 . 


山 一 般 的 中 心 程 限 定理 表明 ,这 一 点 对 一 般 观 测 值 的 算术 平均 仍 帕 立 . 
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这 是 我 们 以 当代 的 观点 来 回顾 狼 莫 弗 工 作 的 意 久 . 可 是 在 当 
时 , 狱 莫 弗 的 工作 并 末 受 到 二 有 的 重视 . 原因 在 于 , 犹 氏 本 人 不 能 算 
是 一 个 统计 学 家 ,他 从 未 从 统 订 党 的 观点 去 考虑 其 工 生 的 意 交 . 他 
的 山 发 点 始终 是 :把 p 作为 一 个 已 知 值 ,如 何在 数值 上 通 近 概率 
btN ,ps1) 和 Pa, 而 不 是 把 记 看 作 未 知 ,如 何 通 过 观察 值 革 去 对 疡 
进行 推断 的 问题 . 比如 , 依 和 他 对 自己 结果 的 看 法 ,无 法 回答 下 述 当 时 
在 统计 界 关心 的 间 题 ;以 p 记 生 男 护 的 概率 . 下 于 案 了 2 468 个 出 


下, 发 现 改 要 有 10 442 个 ; 问 根 据 这 一 -数据 ， 对 疡 拓 方 二 ”的 可 能 性 能 


有 如 柯 之 估 信 ,其实 ,只 须 从 适当 和 角度 加 以 和 解释 ， 区划 项 的 结果 了 避 
3 此 问题 给 出 合理 的 回答 ,与 我 们 今日 上 所 用 的 推理 一 致 . 为 外， 如 不 
捆 记 于 国定 p 已 知 这 一 看 法 ; 狭 氏 的 结 虚 可 以 很 容易 地 转换 成 对 pp 
的 区 向 居 计 的 形式 . 这 一 点 要 等 到 200 年 后 六 由 波兰 统计 学 家 这 受 
提出 来 . 从 这 个 例子 我 们 也 看 到 科学 研究 中 开创 性 观点 提出 之 不 
黎 . 有 有 时 ,产生 某 一 新 观点 所 需 材 料 都 已 准备 ,其 至 接近 了 这 一 观点 
的 边 绿 , 但 由 于 没有 往 这 个 方向 奢 眼 ,这 创新 观点 其 这 一 步 就 出 不 
来 ,数理 统计 学 史上 左 不 蔚 这 样 的 例子 . 


$3 2.6 二 项 概率 逼近 的 其 他 工作 


继 狄 竟 弗 之 后 ,还 有 些 学 者 研究 过 二 项 概率 通 近 这 个 重要 问 
题 , 其 一 是 介 努 利 的 另 一 个 侍 儿 ,丹尼尔 ， 伯 努 利 . 他 在 1770 年 的 
一 籍 论文 中 提出 了 二 项 概 认 的 下 述 通 近 公 式 : 


UO. 56413 2 


btN,p. Np+td)~ (2qprg ?YY em， (21) 


2 
其 中 g 二 1 一 p. 不 过 ,他 这 个 会 \ 式 只 在 p 很 接近 亏 时 才 有 效 ( 具 体 
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地 说 .要求 记 一 玉 十 OON 二 和 2 一 OCYN). 这 个 公式 适用 面 罕 ， 


证 明 难 (不 同 于 狄 莫 弗 的 方法 ) 且 形式 累 玖 ,因而 没有 流 优 下 来 . 应 
当 指 出 :为 变 当 NN 一 3 时 (21) 式 两 边 之 比 趋 于 1; 右边 的 0. 564 13 


应 当 =0. 564 189 58) 来 取代 ， 


寺 尼 饼 管 将 他 的 公式 用 于 一 个 大口 统计 间 题 .此 和 襄 题 是 继 阿 
布 北 请 特 ‘ 见 第 六 章 ) 在 1710 年 作 了 一 个 有 关 人 口 问题 的 统计 假 
坟 检 验 之 后 的 男 一 个 假设 检验 问题 ,其 复杂 和 性 夫 为 增加 且 在 观念 
上 具有 现代 假设 检验 理论 的 特征 ,值得 在 此 稍 作 介绍 . 

丹尼尔 用 的 数据 是 和 白 1664 年 至 1758 年 伦 救 每 年 受洗 (在 此 


等 同 于 出 生 ) 男 、 女 婴 九 数 . 他 算出 男 , 女 婴 数 之 比 为 号 二 9 一 


1.055, 寺 尼 饼 发 瑰 , 厅 每 10 年 一 计 , 则 上 述 比 值 的 最 小 值 在 1721 
年 一 1730 年 这 一 时 期 内 达到 ,为 站 -557 一 1. 040, 他 想 朗 回答 的 问 


是 是 :这 一 差异 究竟 是 出 自 偶 然 昵 ,还 是 由 于 舅 凤 出 生 率 在 1721 
年 一 1730 年 时 期 内 猜 有 下 降 . 于 是 有 两 个 可 能 性 ， 


_1055 ，_1040 
myo055’ PT F040 


其 中 po 蚌 在 认定 上 述 现 象 系 出 自 俩 然 的 假定 下 ,1721 年 一 1730 
年 期 间 男 村 的 出 生 率 ,而 p; 则 是 在 该 期 间 内 男 要 出 生 率 确 有 下 降 
的 假定 下 的 男 昧 出生率 . 

丹尼尔 对 1721 年 一 1730 年 的 每 一 年 计算 npo 一 x 以 及 np; 一 
+ 之 值 . 例如 对 1721 年 ,z= 该 年 出 生男 鼻 数 二 3430,n 二 该 年 出 生 
贤 几 总 数 一 18370. 辣 柴 该 年 

npo— A =, npi—7r=— 65. 

他 发 现 ,10 个 xpo 一 zz 答 都 为 正 ,但 10 个 np 一 z 什 中 ,3 正 7 负 . 
这 旺 冰 也 ， 这 个 值 较为 合理 . 更 进 一 步 ， : 雪 尼 尔 算 出 每 一 年 zz 一 工 


4 


和 np 一 xz 的 或 的 误 差 (probable error)*. 在 作 这 一 计算 时 就 此 水 
及 二 项 概率 . 例如 ,要 算 1721 年 np, 一 + 的 或 然 误 差 4 等 于 求 方程 


| 了 叶 oP _ 下 一 _ 工 
Dp CP po) = 


其 中 4 一 18 370,po 一 23. 丹尼尔 用 (21) 式 计算 上 式 中 的 二 项 概率 


并 用 试 错 法 来 解 a. 在 没有 适当 计算 工具 的 古代 ,这 实在 是 个 容易 . 

对 每 个 ap 一 和 了 ;一 并 都 算出 其 或 然 误差 ae 和 oa 后 ,再 尼 尔 
发 现 , 在 10 个 po 一 x 中 ;满足 |npo 一 x+1 半 as 的 有 5 个 ,而 在 10 个 
npi1 一 中 ,满足 |npi 一 7| 记 a 的 有 3 个 .从 这 个 角度 署 似乎 歼 据 更 
支持 ps( 因 为 按 或 然 误 差 定 义 , |np,; 一 x+1(1= 二 0,1} 超 过 其 或 然 误差 省 


应 约 为 一 半 ). 但 概率 为 亏 的 事件 在 10 次 观察 中 出 现 3 次 并 不 希奇 ， 


让 后 一 分 析 也 并 不 枸 成 对 p: 不 利 的 证 据 . 然而 可 能 由 于 这 一 点 , 丹 尼 
尔 没 有 明确 提出 “在 1721 年 一 1730 年 期 冯 男 时 出 生 率 有 下 降 ” 的 结 
论 . 从 我 们 今日 的 观点 堵 , 如 果 把 符号 检验 用 于 前 一 半分 析 的 结果 
np 一 了 全 为 正 号 }, 有 充分 理由 作出 这 样 的 结论 ， 

拉 苹 拉 斯 在 其 于 1812 年 出 版 的 著作 4 概率 的 分 析 理 论 3 中 也 
讨论 了 这 个 问题 , 记 区 二 LCN 十 1)pj,z 二 m 一 和 Np; 拉 普 拉 斯 在 


a 
/ 寺 保 持 有 罩 的 条 件 下 证 明子 
bEN ,prmitad) = 1 en 
? ” ax pe 


了 车: 为 随机 误差 (例如 此 处 的 npo 一 zx), 则 满足 条 件 PCei<a) 一 十 的 a, 就 称 
为 上 的 或 热 误 差 ， 
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这 里 p' 一 夺 而 g' 一 1 一 p'. 这 并 非 一 确切 的 等 式 而 是 渐 近 公式 
到 (22) 右 边 的 主 项 ,得 到 犹 莫 弗 的 公式 (18). 这 个 公式 的 作用 ,在 
于 对 p 去 去 的 非 对 称 情况 给 予 一 些 校正 . 
丹尼尔 和 拉 普 拉 斯 的 公式 在 现今 教 本 中 已 很 少 提 及 ,但 另 -一 
个 渐 近 公式 则 不 然 , 它 就 是 下 述 著 名 的 公 
limb(N, pA) ee A= lim Np. (22) 
这 公式 在 教 本 中 通称 为 波 哇 松 通 近 公 式 , 它 是 波 哇 松 在 1838 年 于 
一 本 有 关 概 率 在 法 律 审 判 的 应 用 的 书 中 所 引进 . 此 公式 适用 于 $ 
很 小 ,NN 很 大 而 Np 不 其 大 时 ,这 正好 填补 了 狄 莫 弗 公式 的 不 足 ， 
因 后 者 只 适用 于 p 不 太 接近 于 0,1 的 时 候 . 不 过 ,从 历史 上 看 , 狄 
黄强 早 在 1712 年 已 实质 上 作出 了 这 个 半 果 . 
设 z 为 一 具 二 项 分 布 的 随机 变量 . 出 于 赌博 上 的 需要 ,有 一 
些 学 者 考虑 过 下 述 问 题 ;决定 cc, 使 P(A 一 1) 一 了 P(XY 字 cc}, 或 者 
说 ， 
SC pg = 地 9 一 1—p. 
从 碳 弗 将 上 式 改 写 为 
2 Dom 一 9 "r= 三。 
此 即 
1+r O21 + On. Cr 


NN 
令 We. 因 Np-*A, 有 二 >4, 于 是 得 到 


e ‘2| 1++4 十 今 4 十 TE | 
出 此 式 , 用 试 错 ttry and error} 的 方法 去 决定 c 疆 式 的 实质 ,无 非 


嘻 ”两边 取 4 二 8 比较 即 知 . 
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是 用 。 -全 去 取代 二 项 概率 pCN, 思 ,). 但 按 犹 莫 弗 的 上 述 形 式 ， 


取代 上 式 中 的 4 位置 的 ,是 全 一 “ 亿 , 而 非 该 畦 松 形式 中 的 Np, 要 
复杂 一 些 . 更 要 紧 的 是 , 狄 葛 弗 没 有 把 这 个 公式 作为 一 个 单独 的 实 
体 拿 出 来 ,因而 也 就 没有 取得 这 一 公式 的 优先 权 . 

波 哇 松 的 名 字 对 学 概率 论 和 数理 统计 的 人 来 说 ,可 谓 耳 熟 能 
洋 ,原因 主要 在 于 这 个 近 做 公式 ,以 及 更 重要 的 , 源 于 这 个 近似 公 
式 而 来 的 该 硅 松 分 布 ,其 在 离散 型 分 布 中 的 重要 性 和 知名 度 仅 次 
于 二 项 分 布 . 波 哇 松 另 一 个 重要 的 工作 ,是 把 伯 努 利 大 数 定律 推广 
到 每 次 试验 中 事件 概率 不 同 的 傅 况 , 现 称 为 波 哇 松 天 数 定律 , 它 也 
是 首先 出 现在 前 述 1838 年 的 著作 中 . 我 们 前 已 指出 :大 数 定律 这 
个 名 称 就 是 出 自流 哇 松 的 这 一 著作 . 

有 很 长 -- 个 时 期 ,统计 方法 在 社会 问题 中 的 应 用 主要 限于 人 
统计 ,特别 是 男 、 女 婴 出 生 的 比例 问题 . 这 是 一 个 典型 的 与 二 项 
分 布 有 关 的 统计 问题 . 二 项 分 布 相对 比较 简单 的 形式 ,也 使 它 成 为 
一 个 概率 方法 可 有 用 武之 地 的 模 击 . 因此 也 就 不 奇怪 ,推断 统计 的 
最 早 一 个 对 象 就 是 这 个 模型 . 人 们 说 ,在 19 世纪 以 前 ,数理 统计 是 
二 项 分 布 的 天 下 ,进入 19 世纪 后 , 随 着 高 斯 误差 分 布 理 论 的 建立 ， 
正 态 分 布 才 愈 来 愈 在 数理 统计 学 中 取得 中 心地 位 ,一 定 程度 上 前 
到 如 今 . 

二 项 分 布 在 数理 统计 史上 另 一 个 重大 作用 是 , 正 是 由 于 对 此 
分 布 中 未 知 概率 的 推断 的 探讨 , 早 在 18 世纪 中 叶 就 导致 了 贝 叶 斯 
推断 思想 的 建立 . 如 今 这 种 思想 已 发 展 成 为 数理 统计 学 中 的 重要 
学 派 --- 贝 叶 斯 学 派 . 这 方面 发 展 的 历史 就 是 我 们 在 下 -- 章 中 要 
讨论 的 主题 . 


注 1: (3) 式 的 证 朋 . 
记 FCOp)= YbON,pD), £0= [npl 二 1. 则 
i 


闪 33 


FCp} 一 DiCNPpT HO — pT 
i 
— YN — DCNpl ~ py* Tl. (A1) 
t>n 


因此 
2 > Lig — CN— OpIOON, pr) 


| 


2pare' (py) 


1 


2 — NPYGON, pi). 


1 


mi 
因为 > 一 Npyb(N,p,i)》 二 0, 有 


2 一 Np)B(CN, pi) =— DU 一 NPpYDON ,pi). 
由 由 上 两 式 有 妇 得 
DC—2por' (tp)., (2) 


但 出 (AA1) 式 ,并 利用 5CN 一 1,pN) 二 0, 得 
F' (Cp)= DNBCN—1, pri—D— NbN—1,p,i)) 
=NCN—— 7).pre— 17 btN—1l,p,N) 
—NbPN—1,p,4—1). 
以 此 代入 (A2), 并 注意 pNBCN 一 1 ,py 一 1) 一 jbCN,p,p1), 即 得 
所 要 的 结果 . 


注 2:45) 式 的 证 明 . 


因 为 
Pm th "(11 1] 7 一 zm 一 mt mt 
mi 13=] mr 
有 
mm- 1 十 工 
iogb (tm) CO— 12m og2+ Slog (A3) 
r= 1 1 一 二 
利用 展开 式 


此 入 


1 工 十 工 | Ad) 
log j 一 2 这 于 一 了 Ir| 过 1， 


得 
He Moe Vi 1 四 二 
-1 1 一 二 二 一 上 
了 
一 + SR 1 ~ 3 2 上 起 一 I 


对 后 一 个 和 用 第 4 章 (1) 式 ,并 记 1 一“ ,得 


上 一 
Pa 1 


2 1 
mT D 玄关 全 + 站 放生 


有 2 -22 
> 3 (2R 一 ] yi sit 。 


对 (Ad4) 两 过 从 有 0 到 上 积分 ,得 上 式 石 过 第 一 个 和 ,第 2 个 和 和 即 
(A4). 至 于 第 3 个 和 , 记 其 值 为 工 , 改 变 求 和 次序 ,得 


2 
天 一 3 -2 i Ci 


(A) 
因为 
本 1 2 1 3r sm 2 让 一 站 3 一 
2 2 上 I 一 i 3 2 
本 = 1 > Ca 2 Jt- 
二 1 1 上 2 一 13 i- 
oj 十 《1 十 二) 
_ 一 【是 一 了 
-DT 
加 B., 
mT 301) 
由 紫 及 CA3),(A5), 得 


logb Cm) 一 | 27z -一 3 | llog (2m — 1) — 2mlog (2m) 


十 log2 一 3 本 【上 后 ) 
此 可 一 的 意思 是 ; 当 ww 一 oo 时 ,左右 两 端 之 比 殉 于 1. 狄 莫 弗 的 靡 
烤 在 于 他 无 法 算出 (A6) 右 边 那 个 和 的 确 值 ,只 好 到 其 前 4 项 各 作 
为 近似 ,得 


log2 十 ; ! | 


一 300 1260— 1680™ 13 9， 


而 e 一 2.168 2, 这 样 由 (玉昌 得 到 
pim) ~ 2, 168 2(21— 1)" (om) 2 


1 1 Wn 1 ] i 
2.168 2| 1 一 地 | 2. 168 21 1 一 去 | 


一 RE (A7) 
由 (5) 式 ,但 此 处 ~ 已 无 两 端 之 比 趋 于 1 的 含义 . 
行 是 狄 真 弗 当 时 能 算出 
2 1 一 1 一 上 
> | j= 1— Tiog(2n), (A8) 
则 (A7) 式 可 以 用 
El 
pim)~2etor) EL 一- 一 
VN-T 
~2elor) Ee 2 
2e《 2A) J 元 7 


来 取代 :而 此 时 一 已 有 两 边 之 比 趋 于 1 的 意义 ,这 样 就 得 到 了 关键 
的 49) 翅 . 尽 过 来 ,既然 已 用 另外 的 方法 证 明了 (9) 式 , 则 上 述 论 证 
证 明了 (A8) 式 成 立 . 


注 3;(6) 式 种 (3) 式 的 证 明 . 
因 5 ， La 
46 


pim}) mT mt 


声 f Fr 了 ==- | mr 
有 
—1 ] 十 一 
ptmy md 1 m 
log Ferm ras™| 一 一 一 十 >iog 2 【文身 ] 
HH 


右边 的 和 已 在 注 2 中 处 理 过 . 令 :一 针 一 号 ,得 到 右边 的 和 等 于 以 
下 两 个 主要 项 之 和 


-1 中 一 1 a 
?4 一 1) 2 了 (TD 十 2 I 


是 =- 上 


加 上 一 遍 辽 无穷小. 在 注 2 中 己 指 出 过 计算 上 式 中 的 级 数 的 方法 ， 
管 出 结果 代 人 (A9), 妈 得 (6) 式 . 


2 一 
上 


本 


将 (6) 式 中 的 log (mm 十 qd 一 1) 写 为 logm 十 log| 1 二 
jog Cm 一 9 十 1 类 似 处 理 , 用 展开 式 


Tr 


全 
1og (1 十 站 一 一 方 十 可 一 9 


石 边 取 两 项, 用 之 于 iog 1+ | a log | 1— et ;代入 
6) 式 整 理 之 项 得 (13). 


注 4;:(4} 式 的 证 明 . 


我 们 可 以 证 朋 更 强 的 结果 ;对 辕 定 的 ,0 二 pp 过 1, 当 和 NN 一 = 时 
有 


lim max b(tN ,pi)=0. ‘Ai10) 
事实 上 , 记 一 [CCN 十 1) pj. 分 析 比 值 - 人 OP' 站 ,入 见 
. PT p11) 
ptN ,pp 在 i 一 上 时 达 到 最 大 , 且 当 i 总 疡 时 ,2CN ,pp ,i 随 ;增加 而 


4 


十 bh 


] 一 Ds > PUN ,pi) 


1 二 叫 


关 为 
PON pntm) Crmnp” “(1—p) “” 
pNPpsre) Cpil— pr 
! 办 ”| 一 产 一 更 er 
=| ~ 
>| | | (A12) 
而 对 回 定 的 mr 有 
lim 天 


ve pm py) 
此 与 ‘入 12) 结 合 , 可 希 当 NN 充分 大 时， 有 放生 二 以 此 
人 人 (aa11) ,可 知 当 NN 充分 大 时 有 

12 Cm lip(N, pa), 
因而 6CN, py) 所 和 i 当 和 N 充分 大 ,由 澡 的 任意 性 知 
imetN,p'p) 王 0, 于 是 证 明了 所 要 的 结果 . 


注意 这 一 证 明 设 有 利用 (14) 式 (车 用 该 式 .结论 显然 ), 目 的 是 
显示 ,在 犹 葛 烙 1721 年 结 采 的 基础 上 ,已 很 容易 证 明 大 数 定律 . 


注 5:(11) 涉 的 证 上 明 ， 


H= (m1 1 
EY i 
和. 
es Ey 
lI™、 1 上 Be i r+ 
十 Pre — ar orm 量 (A13) 
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其 中 := Sm > 、 对 展 起 

一 |ogft1l 一 工 ) 一 3 开 ， 
两 边 积 分 算出 瑟 右 边 第 1 项 ,最 后 一 个 和 的 处 理 方 起 ,与 4 上 A5) 趟 
右 过 相应 的 和 同 ,经 过 这 些 处 理 , 得 


是 二 1 


了 和 时 和 时 i ~ Ba ee. 
H=m— 1 logm + 2 SRCok yt nm 


1 be > 
nt — ] 210gm 十 2 58 让 一 17'? 当 宝 co. 


CATl4) 
再 用 (A8) ,得 


1 ] 
Hm— wz logm 一 3log (2AX)， 


Eh log| 2 | ~ 区 一 也 logm 一 方 log(27) ,由 此 得 出 (12) 式 . 
C11) 式 风 由 CA14) 并 利用 CA8) 得 出 . 


读者 应 当 注 意 的 是 :在 以 上 的 注 2、3 和 5 中 ,我 们 介绍 的 是 狄 
莫 弗 的 原来 的 证 法 ;现代 教科 书 则 从 斯 特 灵 公式 出 发 ,论证 要 简单 


at 


rr 出 
| 
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第 三 草 ” 贝 叶 斯 方法 


在 前 面 介绍 的 伯 努 利和 狭 莫 弗 的 两 项 恒 大 成 果 中 ,主角 都 是 
一 项 分 布 . 无疑, 在 早期 的 概率 统计 史 中 ,这 是 惟一 的 一 个 分 布 ,其 
研究 达到 相当 的 深度 . 应 用 上 的 重要 性 及 其 较 简 单 的 形式 ,是 使 二 
项 学 布 得 到 众多 学 者 关心 的 原因 . 

本 草 继 续 这 个 主题 ,讲述 数理 统计 史上 男 一 项 以 二 项 分 布 为 
主 骨 的 工作 ,其 影响 和 重要 性 不 亚 于 上 述 两 项 成 果 , 这 就 是 英国 学 
背 贝 叶 斯 在 18 世纪 中 吁 ,为 解 汰 二 蘑 分 布 的 概率 的 倘 计 间 题 所 提 
出 的 一 种 方法 ,但 方法 的 思想 并 不 止 适 用 于 这 一 特定 阿 题 . 事实 
上 ,` 册 叶 斯 的 思想 ,经 过 其 支持 者 的 发 展 并 因 其 在 应 用 上 的 良好 表 
璃 ,如 今 已 成 长 为 数理 统计 学 中 的 两 个 主要 学 派 之 一 一 一 贝 叶 斯 
子 派 ,占据 了 数理 统计 学 这 块 领地 的 半壁 江山 . 


9 3.1 贝 叶 斯 及 其 传世 之 作 


托马斯 "由 时 斯 (Thomas Bayes,1701 一 1761) 其 人 在 18 志 

纪 上 半 叶 的 欧洲 学 术 界 , 玉 怕 不 能 算是 一 个 很 知名 的 人 物 . 在 他 生 

丙 , 兴 有 发 表 片 纸 只 字 的 科学 论著 . 那 时 ,学 者 之 间 的 私人 通信 ,是 

传播 和 交流 科学 成 果 的 一 种 重要 方式 . 许多 这 类 信和 依 得 以 保 疮 下 

沪 并 发 表 传 世 , 而 成 为 科学 史上 的 重要 文献 ,例如 第 二 章 中 提 到 的 
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费 尔 马 和 巴 斯 辜 的 通信 ,但 在 只 叶 斯 来 说 ;这 方面 材料 也 不 多 .在 
他 生前 , 除 在 1755 年 有 一 封 致 约 草 ， 康 四 的 信 ( 其 中 讨论 了 辛 仿 
森 有 关 误 差 理论 的 工作 , 见 第 五 音 ) 见 诸 纹 戎 的 文件 外 ,历史 上 上 没 
有 记载 他 与 当时 的 学 术 界 有 何 重 要 的 交往 .但 他 曾 在 1742 年 当选 
为 美国 皇家 学 会 会 员 ( 相 当 于 科学 院 院 士 ), 因 而 梧 以 想 册 ,和 他 必定 
曾 以 菜 各 方式 表 卉 出 其 学 术 道 论 而 为 当时 的 学 术 界 所 导 认 .如今 ， 
我 们 对 这 个 生性 级 父 , 哲 笠 气 味 重 于 数 竺 气味 的 学 术 怪 杰 的 了 解 ， 
方 要 是 地 的 一 篇 匮 汐 An essay towards solving a problem in the 
aocirine of chances( 机 而 理论 中 一 个 问题 的 解 ) 竟 遗 作 . 此 文 发 表 
后 和 银 长 一 个 时 期 在 学 术 界 没有 引起 什么 反 啊 ,但 到 20 世纪 以 来 突 
然 受 到 人 人 的 重视 ,成 为 贝 叶 斯 学 派 的 韵 基 石 . 1958 年 ,国际 权威 
性 的 统计 杂志 《4Biometrika 江 生物 计量 ?全文 重新 刊载 了 这 篇 文 
章 . 此 文 也 有 了 中 译本 ( 见 亡 文 等 译 《 册 时 斯 统计 学 一 一 原理 .模型 
及 应 用 ?有 附录 4, 中 国 统计 出 版 社 1992 年 版 》. 
此 文 是 恺 的 两 篇 间作 之 一 ,首次 发 表 于 1764 年 伦敦 皇家 学 会 
的 刊物 Philosophical Transactions》 上 ,此 文 在 风 叶 斯 生前 已 写 
就 ,为 何 当 时 未 交付 发 表 , 后 来 的 学 者 有 些 玺 测 , 信 均 不 足 定论 . 据 
文 陕 沁 载 ,在 和 他 逝 贷 之 前 4 个 月 ,他 在 一 幸 遗 书 中 将 这 交 及 100 英 
迄 付 托 给 一 个 叫 普 药 斯 移 学 者 ; 面 贝 叶 斯 当时 对 此 人 在 何 处 也 不 
了 然 . 所 邓 的 县, 后 来 普 莱 斯 在 贝 叶 斯 移 文 件 中 发 吏 了 这 往 文 章 ， 
他 于 1763 年 12 月 23 日 在 合家 学 会 上 宣读 了 此 文 , 并 在 次 年 得 到 
发 表 . 发 表 时 普 莱 斯 为 此 文 写 了 一 个 有 实质 内 容 的 前 育 和 附录 . 据 
背 莱 斯 说 ,中叶 斯 自己 也 稚 备 了 一 个 前 言 . 这 使 人 们 无 法 确切 区 
分 :那些 思想 属于 册 叶 斯 本 大 ,哪些 是 普 革 斯 所 附加 ， 
由 叶 斯 写作 此 文 的 动机 ,说 法 也 不 一 . 一 种 玫 面 上 看 来 显然 的 
席 法 ,是 为 了 解决 伯 努 利和 狄 莫 弗 未 能 解决 的 ,二 项 分 布 慨 率 p 
的 "这 概率 "问题 ,因为 当时 距 这 两 位 学 者 的 工作 发 表 后 尚 不 外, 有 
的 记 为 他 是 受 了 前 面 提 到 的 辛普森 误差 工作 的 触动 , 想 为 这 种 问 
题 的 处 理 提 拱 一 种 新 的 思想 . 还 有 人 主张 , 贝 叶 斯 写作 此 交 , 蚌 为 
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了 给 * 第 一 推动 力 ” 的 存在 提供 一 个 数学 证 明 . 这 些 说 法 现在 部 无 
从 考证 . 

上 面 提 到 * 道 概率 ”这 个 名词. 在 较 早 的 统计 学 著作 中 这 个 名 
闻 用 得 较 多 ,现在 已 亚 渐 淡出 . 左 名 思 头 , 它 是 指 求 概率 这 个 问题 
的 道 间 题 ”; 已 知事 件 的 概率 为 记 ; 可 由 之 计算 某 种 观察 结 采 出 现 
的 概率 如 何 . 反 过 来 ,给 定 了 观察 结果 , 问 由 之 本 以 对 概率 产 作 出 
在 何 之 推断 ? 推广 到 极 处 可 以 说 ， 正 概率 "是 由 原因 推 结果 ,是 福 
率 论 六道 概率 "是 结果 推 原因 ,是 数理 统计 包 . 


8S3.2 贝 叶 斯 的 问题 提 法 


在 文章 的 前 言 中 ,明确 握 出 了 该 文 要 讨论 的 问题 :给 定 了 一 个 
事件 在 -系列 观察 中 出 现 的 次 数 和 不 出 现 的 次 数 , 并 给 定 两 个 数 ， 
要 求 该 事件 在 一 次 观察 中 出 现 的 概率 8 落 在 此 两 数 之 间 的 机 遇 . 

有 些 隐 省 的 假定 受 有 在 这 一 表述 中 明确 写 出 来 , 即 要 求 这 一 
系列 观察 构成 他 努 利 概 型 ;在 各 次 观察 中 事件 的 概率 8 保持 不 三 ， 
是 冲 次 观察 独立 . 这样, 在 六 次 观察 中 事件 出 现 的 次 数 和 ,服从 二 
项 画布 BCN ,9). 用 现代 的 记号 ,由 于 斯 的 问题 可 表述 为 : 设 玉 上 服 
从 二 项 画布 BCN ,四 ,NN 已 知 而 未知, 络 定 常数 4,8,0 所 4 之 5 所 
1. 在 得 到 观 窒 值 XX 后 ;要求 条 件 概 率 P(ta<9<5|XK). 

由 叶 斯 的 这 个 提 法 ,可 能 受到 当时 流行 的 一 些 人 口 统计 问题 


的 影响 . 例如 ,为 证 明生 男 婴 的 概率 9 比方 大 ,在 所 观察 的 N 个 出 


生 要 儿 中 发 现 男 楼 久 人 ,要 由 此 计算 P( 少 <-6<<1|X). 若 此 值 相 


中 在 不 省 艇 计 学 文献 中 , 道 概 率 dinverse probability) 是 区 时 斯 方 靶 的 一 种 指称 . 
Se 


当 接近 1, 则 是 8 大 于 文 的 有 力 证 明 . 由 于 人 们 对 自己 不 确实 了 解 


的 东西 5 如 些 处 的 g 值 ?都 有 一 种 从 机 遇 的 其 庶 去 看 待 的 习 避 , 这 
个 提 法 很 符合 于 常人 的 思考 方式 .直到 后 来 , 当 册 叶 斯 学 族人 性 为 统 
计 学 中 的 一 个 大 学 派 上 崛起 时 ,大 们 才 团 过 头 去 审视 这 一 媒 污 中 所 
包 合 的 问题 .反对 省 所 持 的 意见 是 :在 任何 一 个 特定 的 具体 问题 
中 ,概率 8 虽然 未 知 , 但 总 只 能 取 一 个 确定 的 值 ;比如 你 面前 有 一 
个 咎 子 , 内 中 训 妇 球 和 基干. 黑 球 若 于 -向 题 在 于 估计 从 得 睾 中 抽出 
日 球 的 概率 8. 你 可 以 不 知道 8, 但 #8 共 能 有 一 个 值 . 照 这 样 看 ,Pia 
三 865|X) 只 能 取 两 个 值 :或 者 为 1( 如 果真 的 在 La.81 内 ) ;或 者 
0( 如 果 8 在 La,Pj 之 外 ), 且 这 个 条 忻 概 率 与 观察 结果 区 无 关 |! 
这 个 观点 置 来 无 懈 可 击 ,但 还 可 以 有 其他 的 考虑 :尽管 8 在 一 特定 
问题 中 是 有 一 个 确定 的 值 ,但 因为 你 不 知道 它 观察 值 六 透 需 
了 了 有关 六 的 大 十 信息 ,但 仍 不 能 确实 定 出 9, 这 就 有 一 个 机 遇 的 成 
分 - 凡人 对 斯 的 提 法 无非 是 把 8 取 各 种 可 能 值 的 机 遇 作 为 研究 对 和 象 
提出 来 . 比如 说 ,你 现在 去 某 人 家 里 找 他 . 明知 结果 不 出 "找到 "和 
“ 挠 不 到 "这 两 种 ( 且 这 昨 你 在 踏 上 时 就 已 确定 了 ,不 过 你 不 知道 而 
已 ,但 你 在 路 上 也 许 仍 然 会 禁不住 去 估计 此 行 能 找到 某 人 的 机 会 
有 多 大 .这 实际 上 就 是 一 穆 贝 叶 斯 式 的 思考 方式 . 


8 3.3 员 叶 斯 假设 


握 出 求 条 件 概 率 的 问题 ,就 意味 着 要 把 9 看 成 一 个 随机 变量 ， 

这 是 内 叶 斯 学 派 的 基本 观点 . 这 一 点 虽 在 看 法 上 可 以 有 分 睹 ,不 妨 

芹 时 摘 置 在 一 边 . 但 有 一 个 根本 问题 却 是 回避 不 子 的 :要 计算 8 的 

条 件 分 布 , 就 必须 知道 8 的 无 条 件 分 布 一 -- 即 在 观察 到 针 之 值 以 

前 如 有 如 何 的 分 布 ? 贝 叶 斯 论文 的 主体 可 以 说 就 在 于 处 理 这 个 问 
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题 . 他 先 用 一 种 公理 化 数学 中 的 演绎 式 推 理 推出 夺 寺 命题 ,然后 用 
一 种 别出心裁 的 模型 与 之 结合 ,提出 了 所 提问 题 的 一 种 解法 . 

丰 叶 斯 从 概率 概念 开始 ,他 拒 概 率 定 义 为 对 某 种 未 知情 况 出 
现 田 能 性 大 小 的 一 个 主观 测度 ,这 与 在 他 以 前 就 流行 的 主观 概率 
定义 并 无 二 致 ( 改 由 叶 斯 一 开始 就 是 把 他 的 方法 与 主观 概率 联系 
起 来 ,时 至 今日 ,“ 正 统 ” 或 ”纯正 ”的 贝 叶 斯 派 ,也 就 是 指 其 坚持 主 
驱 概 率 这 一 点 ). 接着 他 对 这 种 答 率 证 明了 了 几 个 命题 ,其 中 有 关于 
条 件 概 率 的 命题 3 和 和 命题 5: 设 玖 ; 和正, 是 按时 间 先 后 的 两 个 事 
件 , 则 有 


Ek 
PEE = 《命题 3) 
PeE [FE 


现今 的 读者 会 觉得 这 些 命题 不 过 是 条 件 概率 的 定义 ,尤其 难以 理 
解 为 他 变 分 立 出 两 个 命题 . 员 计 斯 的 想法 可 能 是 当时 流行 于 学 术 
短 的 一 种 颇 阿 :一 场 蓝 从 "first principle* 出 发 . 而 且 , 由 于 事件 吾 ， 
和 五: 有 先后 时 间 磊 序 ,两 个 命题 的 意义 不 同 : 一 个 是 由 过 去 (五 )) 
测 未 来 ,南田 一 个 则 基 由 未 来 反 测 过 去 ;二 者 不 是 一 回 事 ， 


天 3.1 
在 作 了 这 些 准 备 后 , 贝 叶 斯 回 到 关于 #8 的 {无条件} 分布 问 题 . 
他 构想 了 一 个 别出心裁 的 “台球 模型 ”一 一 这 名词 是 费 积 尔 的 称 
呼 , 而 非 页 吁 斯 本 人 所 用 :有 一 张 矩 形 的 台球 桌 ( 如 图 3.1), 不 妨 
设 其 长 边 为 1. 有 甲乙 二 人 , 甲 先 向 桌 上 抛 一 个 球 4, 使 此 球 落 在 
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浊 面 上 任何 --- 交 有 同等 机 会 ( 球 补 为 一 个 点 * 下 同 ). 证 4 的 横 坐 
标 为 上, 则 由 4 服从 台面 上 的 均匀 分 布 , 可 知 品 服从 10,1j 区 间 上 
的 均 名 分布 R(0,1). 过 4 必 一 直线 系 直 手 举 面 的 长 按 , 它 与 长 按 
之 充 点 即 为 岂 然 后 甲 再 阿 台面 上 抛 手 六 个 球 ( 图 3. 1 中 的 Xx), 每 
个 球 的 位 置 服从 台面 上 的 均匀 分 布 且 各 次 抛掷 独立 , 甲 数 清 这 属 
ee 企 在 庶 线 左边 的 个 数 海 XX. 甲 把 和 NW 和 区 这 两 个 数据 告 许 

己 :但 不 音 拆 他 缚 之 值 . 甲 要 求 乙 依据 NN 和 三 去 估计 品 落 在 一 所 
定 区 间 La.58] 内 的 概率 江 . 

内 时 斯 使 用 这 样 一 个 奇特 的 模型 ,是 为 了 性 现 一 个 在 他 问题 
担 法 中 玉音 明 的 条 件 : 事 先 对 日 绝对 一 无 所 知 : 抛 一 个 球 在 台面 上 
吾 使 它 落 在 各 处 为 等 可 能 , 则 除非 亲自 朝 台 面 看 一 看 ,有 理由 说 我 
对 球 的 位 置 一 无 所 车. 因此 ,; 贝 叶 斯 把 “对 8 之 值 一 无 所 知 * 这 一 合 
六 不 精确 的 说 法 ,通过 这 个 模型 的 直观 上 的 观照 ,数学 化 为 日 有 
RR(D0,1) 均 守 分 布 这 个 确 妇 的 陈述 ,后 入 把 “ 信 有 均 名 分布 RC0,1)” 
这 一 陈述 称 为 册 叶 斯 健 设 ,有 时 也 称 为 “同等 无 知 ” 假 设 .8 的 分 布 
01) 因为 是 在 作 实 验 之 前 定 下 的 , 故 称 为 先 验 分 布 一 一 所 育 
先 验 分 布 就 是 日 的 无 条 件 分 布 . 

把 2 一 有 R49:1) 作 为 “在 试验 前 对 8 一 无 所 知 ” 的 一 种 解 酸 一 - 
民 叶 斯 假设 . 到 后 来 引起 很 多 争议 . 诚然 ,就 贝 叶 斯 的 台球 模型 面 
言 , 这 是 绝 对 合理 的 . 由 时 斯 的 原意 是 : 当 我 们 商 对 一 个 对 之 训 无 
所 条 的 概率 值 时 ,情况 就 正如 台球 模型 中 的 8 一样 . 这 一 点 就 不 
见得 是 毫 无 疑 尺 了 , 百 余 年 后 费 歌 尔 就 曾 提 出 了 一 个 有 力 的 所 面 
意见 : 知 是 对 2 一 无 所 知 ,那么 对 8 的 一 个 亢 数 ,例如 贸 , 也 有 是 -一 无 
所 各 , 豆 按 贝 秆 斯 假设 ,信也 应 该 有 均 名 分 布 RC0,1), 这 就 与 8~ 
(O41 产生 了 并 盾 .不 过 , 贝 叶 斯 对 取 8 一 玉 (0.1)? 还 提供 了 另 一 
个 有 力 的 论据 , 见 下 立 


作为 怪 于 表达 清楚 ,此 处 的 盘 这 与 员外 荔 的 基文 有 些 了 不同., 实 质 是 一 团 事 ， 
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83.4 问题 的 解答 


在 有 了 先 验 分 布 8 一 有 ro,1) 后 , 贝 呈 斯 所 查 问 题 的 解 就 不 难 
导出 :因为 
Ps( 事 件 出 现 六 深 ) 二 CXO(1 一 0**， 
控 全 概率 公 却 ,有 
记事 件 出 更 三 次 ) 


1 
= | CPG — 0d0 = (ON 十 DR 一 ON (1) 
总 


上 而 Py 表示 概率 是 在 固定 8 时 计算 的 , 即 纵 定 8 佣 时 的 条 件 概 
率 , 而 是 无 条 忻 概率 . 按 凡 叶 斯 的 命题 5, 有 
Ptassess2l 事件 出 现 勤 次 ) 


ass 事件 出 现款 次 ) (2) 
P( 事 件 出 现 羡 次 ) 


轴 根 据 他 的 命题 3, 有 


由 上 
== | P( 事 件 出 现 X 次 )d9 二 CX| 0 一 "xd9. (3) 


结 台 (1 一 (37, 即 得 
Pla 寺 pp | 和 潮 件 出 现 芭 次) 
| ora ~ 0*-xde ， 
一 一 一 一 (MYV 十 DC2| FO 一 的 > qd (4) 

jea — Oy *qo : 
这 就 是 贝 叶 斯 给 出 的 解答 . 以 现今 读者 的 眼光 看 ,上 述 推 理 过 程 是 
清 清 楚楚 ,直截了当 的 , 世 不 过 是 常见 的 求 条 件 概率 窗 诬 方法 的 一 
个 具体 鲍 子 ,但 在 贝 叶 斯 时 代 没 有 这 个 篇 单 . 例如 , 那 时 全 概率 公 
式 只 有 有 限 个 事 忻 组 的 情况 , 击 关 键 的 (3) 式 [(1) 式 是 燕 特例 J 不 
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篇 于 这 种 情形 . 风 叶 期 为 达到 此 式 经 过 了 一 番 细 心 的 论证 ,并 通过 
用 稚 梯 毅 数 遂 近 六 (一)* ,以 转化 到 有 限 事 件 组 的 情况 . 
这 个 解 中 所 涉及 的 积分 


Plus C= | Tx dr #0, v0, 
已 
称 为 完全 及 积 分 ,而 
让 (Pa 一 | 一 dr, OEal Ov ， 


称 为 不 完全 积分. 当 w.v 为 整数 (如 在 此 处 的 情形 } 生 有 一 个 较 
小 时 ,此 积分 可 直接 计算 .但 在 实用 上 ,二 者 都 很 大 的 情况 也 常见 ， 
这 和 时间 题 或 难 办 . 卡尔， 皮尔 迄 兽 编制 了 《不 完全 六 函数 表 》 以 殿 
此 用 途 . 见 叶 斯 自己 在 其 论文 中 也 讨论 到 这 个 问题 ,他 的 方法 是 用 
两 个 晤 数 从 上 .下 两 方 通 近 被 积 函 数 以 估计 积分 的 上 .下 界 , 可 是 
这 上 .下界 的 计算 也 不 易 , 尤 其 是 ,二 者 并 不 充分 接近 . 普 药 斯 也 曾 
关注 这 个 问题 ,他 在 贝 叶 斯 论文 的 附录 中 ,用 由 吐 斯 的 条 近 算 了 一 
个 实例 ,其 中 : 
ID0 1 10 1 


二 人 4 = 一 一 一 - 一 -一 3 二 一 一 一 一 = 一 
这 二 D, a T TI0 TI N==] i100. 


他 算出 0.7953< 二 Pla 坊 05 | })< 二 0. 9405. 即使 其 实用 观点 看 ,这 
了 上 .下 和 弄 的 差异 也 沉 太 天 了 . 
拉 普 拉 斯 1774 年 在 一 篇 半 于 道 概率 的 文章 中 也 试图 处 理 这 
个 同 题 ,但 未 能 取得 一 个 满意 的 缚 果 . 但 在 作 这 人 性 事 时 他 限 带 证 明 
了 一 个 有 意思 的 结果 ,现在 称 为 “ 贝 叶 斯 相合 性 ”*; 设 概率 的 真 值 为 
引 作 NN 次 试验 ,观察 到 事件 出 再 XX 次 , 任 给 e 汪 0, 按 公式 (4) 有 
Pi —~etoe +e | Xu) 


=N+DCE| G01 ~ 0)*-xvdg 
科普 拉 斯 证 明 : 当 六 一 cc 时 ,上 式 右边 依 概率 收敛 于 1. 这 说 明 ;只 


要 试验 次 数 N 是 铝 大 ,2 将 以 任意 接近 于 芋 的 概率 落 在 蝇 的 一 个 
尾 意 小 的 近 旁 ( 注 1). 


口 了 


$ 3.5 页 叶 斯 假设 的 另 一 种 解释 


页 叶 斯 的 基本 假设 是 8 一 Rt0,1),; 要 从 对 产 对 一 无 所 知 ” 这 
种 不 确切 的 概念 出 发 ,经 过 逻辑 推导 而 得 出 页 叶 斯 假设 是 不 可 能 
的 ,因而 也 就 无 法 妥善 地 回答 费 歌 尔 提 出 的 那 种 质疑 .但 是 , 细 察 
届时 斯 论文 中 的 论述 ,他 对 “ 钨 对 一 无 所 知 ”" 男 有 一 种 解释, 比较 有 
说 服 态 . 

他 的 解释 基于 (1) 式 :此 式 对 王 取 0,1.… 交 ,这 入 二 1 个 可 
能 值 中 的 每 一 个 给 以 等 概 雍 (十 1) .他 认为 这 个 靖 果 是 对 "第 
对 一 无 所 知 ” 的 一 种 合理 的 解释 ,而 这 一 结果 ;下 是 玉 计 斯 假设 
8 一 Ri 1 的 直接 后 果 . 

可 羽 用 一 个 禹 俗 的 例子 来 说 明 这 一 点 . 设 甲 . 乙 二 人 打算 下 
N 局 械 ,每 局 甲 胜 的 概率 为 8 以 基 记 六 局 中 甲 胜 的 局 数 . 设想 你 
对 甲乙 二 大 的 棋 共 “绝对 一 无 所 知 ”, 你 对 于 取 备 种 值 的 可 能 性 
会 如 何 估 计 ?” 看 来 合理 的 估计 是 :下 取 0,i,:" ,NN 部 有 可 能 ,所 可 
能 性 相同 . 

对 这 一 讲法 , 驶 难 者 可 能 会 说 :这 仍 不 能 说 服 我 . 因为 ,如 果 我 
对 四 . 乙 棋 艺 真 十 弧 对 一 无 所 知 , 我 也 可 以 自然 地 很 定 甲 胜 的 概率 
0 可 取 L0,1j 内 任何 什 , 瑟 机 会 相同 ( 即 贝 叶 斯 条 设 ). 所 以 ,这 个 论 
点 的 力 认 并 不 见得 太 于 负 时 斯 假设 的 力度 ,但 是 这 里 有 一 点 不 同 ，; 
直接 取 8 一 R(0,1) 不 能 避免 费 歌 尔 那 种 责难 ,而 由 (1) 式 出 发 则 没 
有 这 个 问题 .因为 ,设想 你 取 任 一 个 单调 晤 数 gz. 则 {1} 式 与 

PagtXi)=pgtD= (N11) ,i=0 ly 
是 等 价 的 ,不 存在 (1) 这 个 假定 随 所 选 油 数 g 之 不 同 而 改变 的 博 
深 , 因 之 费 葡 和 汞 提 出 的 那 种 质疑 在 此 不 成 立 ， 
剩 下 在 理论 土 还 有 一 个 问题 :固然 ,由 员 寺 斯 假设 8~-R(0,1) 
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可 推出 501) ,但 反 过 来 是 否 成 立 ? 即 :是 否 有 吕 的 其 他 先 验 分 布 也 可 
导出 (127 可 以 证 明 ( 注 3): 不 存在 关 50, 1 之 外 的 这 种 先 验 分 布 ， 
这 样 就 最 终 确 立 了 上 述 解 释 的 合理 性 . 这 种 解释 方法 还 可 以 用 于 
其 他 更 复 困 的 情况 , 见 后 文 . 


$ 3.6 拉 普 拉 斯 的 不 充分 推理 原则 


所 已 提 惧 , 贞 外 斯 工作 发 表 后 很 长 一 个 时 期 ,没有 得 到 学 术 界 
的 注意 ,因而 他 这 种 思想 未 能 及 早 发 展 成 为 一 种 得 到 广 斌 应 用 的 
统计 推断 方法 .但 是 ,也 有 些 学 者 独立 她 朝 这 个 方 疝 考虑 ,提出 类 
位 思想 并 付 傅 实用 ,其 中 最 重要 的 是 拉 普 拉 斯 . 

拉 善 拉 斯 在 1774 年 一 篇 文章 中 提出 了 所 请 “不 充分 推理 原 


则 【Prineiple of insufficient reasoning). 他 的 思想 大 致 如 下 :如 果 
一 个 向 题 中 存在 若干 个 不 同 的 原因 (cause)4 ,4 , 则 在 没有 理 


由 认为 其 中 那 一 个 特别 有 优势 时 ,是 先 验 概率 应 各 取 为 工 , 即 认为 


和 公有 同等 机 会 出 现 . 在 统计 问题 中 ;这 里 所 说 的 不 同 的 “cause ”A)， 
2:"… 可 奢 作 代表 未 知 参 数 的 不 同 的 可能 值 . 以 下 记 在 这 种 原因 


下 可 能 产生 的 事件 (例如 ,在 菜 参 数值 之 下 观察 到 的 样本 ), 拉 普 拉 
斯 握 出 : 


5 
用 现今 熟知 的 概率 论 知 识 很 容易 证 明 (5), 仙 拉 普 拉 斯 在 其 文章 中 
用 本 一 个 很 复杂 的 证 法 . 拉 普 拉 斯 的 原则 (5) 可 用 于 由 PCE|A,) 
扒 PCA,|E), 这 与 员 叶 斯 的 原则 一 样 ,后 而 ( 见 第 五 章 ) 我 们 将 介 
绍 拉 性 拉 斯 将 这 一 原则 应 用 于 误差 分 析 . 可 以 看 到 , 拉 普 拉 斯 的 思 
想 并 未 起 出 贝 叶 斯 的 范围 ,因此 现在 统计 史上 也 不 把 他 算 作 册 吐 
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斯 统计 的 一 个 莫 基 者 . 
§ 3.7 贝 叶 斯 统计 学 


统计 推断 一 般 的 模式 是 :样本 七 的 分 布 或 概率 密谋 fotx}) 依 
环 于 术 知 参数 98, 只 知道 8 属于 某 一 集合 昌 , 但 不 知 蕊 到 台中 的 何 
伟 . 统计 推断 的 任务 ,就 是 依据 所 抽 得 的 样本 芯 去 作出 某 种 有 天 
之 仁 的 论断 ,例如 对 8 的 值 作 一 估计 ;或 判断 8 是否 落 在 全 的 某 个 
指定 子 集 例 ' 之 内 等 .例如 对 某 事 件 观 察 引 六 次 ,以 瑟 汇 事件 山 现 
次 北 , 则 和 梓 本 七 有 二 项 分 布 呈 (vv 人 ,只 知道 0 夺 9 寺 1 而 不 知道 #8 
确实 仁 . 这 根据 梯 本 六 对 #8 作出 推断 . 

这 种 推断 ,或 者 说 推理 ,是 归纳 式 的 ,与 在 理论 数 掌 中 常见 的 
演绎 趟 推理 ( 鲍 如 凭 异 一 组 艺人 和 何 公理 证 明 几 和 何 命题 ?不同 ,对 它 无 
法 手册 一 世 能 被 大 家 承认 的 公理 蛋 系 . 虽然 也 有 学 者 试 贸 为 这 种 
推断 提出 一 些 原 则 (例如 ,A.P. Dawid 在 #Conformity of inference 
patterns(t Recent Advances in Statistics ,245~— 256.) 一 文中 
提出 了 8 个 这 种 原则 }), 但 多 有 其 不 足 之 处 , 且 即 使 加 以 实行 ,也 无 
法 虑 之 导出 一 个 可 操作 的 推断 方法 来 .这 本 质 上 是 因为 ,样本 飞 
中 只 包 售 了 8 的 部 分 而 不 是 全 部 信息 :在 日 常生 活 中 , 当 大 家 对 基 
件 事 傅 的 情况 了 解 不 全 而 时 ,会 有 各 种 人 提出 看 起 来 都 有 些 道理 
的 磺 法 ,而 一 旦 对 情况 完全 了 解 了 ,意见 就 可 能 归于 一 致 ,这 个 不 
大 由 切 的 比喻 密 少 显示 了 统计 推断 的 为 难 之 处 ,以 路 人 们 在 此 问 
对 上 可 以 有 分 由 的 主张 和 想法 . 

按 好 今 统计 学 的 状 沉 , 人 们 关于 统计 推断 该 如 何 做 这 个 问题 
时 主张 和 想法 ,大 都 可 以 销 入 两 个 体系 之 内 ,其 一 叫做 频率 学 派 ， 
其 特点 是 把 需要 推断 的 参数 8 视 为 男 定 的 未 知 常数 而 样本 天 为 
随机 的 ,其 看 眼 点 在 样本 空间 ,有 关 的 概率 计算 都 是 针对 成 的 分 

G0 


布 . 另 一 叫 航 由 时 斯 学 派 ,其 特点 正好 与 上 述 相 反 : 参 数 避 视 为 随 
机 变量 而 样本 蔷 视 为 固定 的 ,其 着 腿 点 在 参数 空间 ,重视 的 是 参 
数 吕 的 分 布 . 

这 二 者 的 差别 在 估计 二 项 分 布 概率 8 的 问题 中 看 得 很 清楚 ， 


以 各 记事 件 在 N 次 观察 中 出 现 的 次 数 . 用 频率 等 估计 6, 其 与 6 
接近 的 程度 ,可 以 用 方差 E| 窜 一 9| 去 衡量 .这 求 期 望 的 运算 是 
针对 X 的 分 布 ,9 始终 看 作 固定 ,没有 随机 性 . 可 是 前 面 讨论 的 中 
叶 斯 的 解法 就 不 同 : 这 个 解法 的 实质 内 容 在 于 :原来 我 们 对 8 的 了 
解 是 它 有 分 布 R(0,1)( 作 试验 前 9 的 先 验 分 布 ). 经 过 样本 节 的 
信息 的 加 入 ,我 们 把 对 8 的 了 解 调 整 为 8 分 布 (CN 十 DCXH(C1 一 
8)” 让, 其 对 比如 下 图 的 ta) ,tb); 经 过 样本 XX 信息 调整 后 的 8 的 


分 布 , 山 给 年 区 条 件 下 的 条 件 分 布 . 从 图 上 看 出 :经 过 样本 的 作 
用 ,我 们 对 8 的 了 解 有 了 不 同 . 原先 认为 8 了 肥 [0,1] 内 各 值 有 同等 


的 机 会 ,现在 认为 ,2 取 窜 附近 之 值 的 机 会 较 大 , 离 基 远 的 信和 则 视 


会 较 小 . 这 在 某 种 程度 上 与 前 面 用 泡 人 生计 6 的 做 法 合拍 


0 XN ] 
(a) (b) 
先 验 分 布 RR(0,1) 后 验 分 布 Plzf 十 1,N 一 zz 十 1) 
有 订 件 分 布 8 区 称 为 (有 了 样本 站 之 后 )8 的 后 验 分 布 .“ 先 ” 
“后 之 分 ,全 在 于 分 布 是 产生 在 有 了 样本 之 前 还 是 以 后 . 所 有 的 后 


sr 


4 在 页 叶 斯 统计 中 ,也 要 用 到 样本 分 布 , 困 而 看 来 也 是 把 X 视 为 随机 .但 其 使 出 
是 息 示 和 狂 的 :于 为 邯 得 后 验 分 布 ,与 其 在 策 认 学 演 中 的 作用 不 同 . 
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续 推 断 全 是 依据 后 验 分 布 . 比如 说 要 找 一 个 单一 的 值 估计 9, 可 以 
取 后 验 分 布 的 期 望 ,在 此 例 为 AL3. 车 要 判断 “9 志 少 ”的 假设 是 否 


可 信 , 可 依 此 后 验 分 布 算出 9< 志 的 概率 ,等 等 . 


按照 这 种 方式 进行 统计 推断 的 全 部 理论 和 方法 ;构成 所 谓 ” 由 
哇 斯 统计 党 ”", 信 和 奉 这 种 统计 学 的 统计 学 家 ,构成 统计 学 中 的 * 内 叶 
斯 学 弛 六 . 

这 个 学 深 安 端 于 贝 叶 斯 的 前 述 工作 ,经 过 百 余 年 的 沉寂 ,到 
20 世纪 上 半 叶 ,经 过 一 些 学 者 的 就 网 而 复活 ,到 20 世纪 下 半 叶 进 
和 人 全 贤 时 期 .在 这 中 则 起 过 重要 作用 的 有 杰 弗 里 斯 人 H. Jeffeys)， 
他 在 1939 年 出 版 的 概率 论 》 一 书 , 如 今 成 了 内 叶 斯 学 泌 的 经 典 著 
作 . 防 几 奇 (LL.J.Savage) 在 1954 年 出 版 了 4 统计 推 斯 j 一 书 ,也 是 
见 叶 斯 学派 的 力作 .还 有 林 得 芋 CD. VY. Lindaley ,他 写 了 不 少 鼓 欣 
由 时 斯 统计 的 兰 作 . 前 述 两 人 的 著作 偏 于 理论 和 思辨 , 击 林 德 莱 的 
著作 则 比较 具体 ,他 给 一 些 重要 的 频率 学 派 工 作 以 幢 叶 斯 统计 的 
解释 ,因而 在 应 用 界 有 更 大 的 影响 . 

内 叶 斯 学 派 在 20 世纪 上 半 叶 不 得 势 的 原因 ,一 是 像 费 歇 尔 、 
条 受 这 样 的 天 统计 学 家 对 它 持 否 定 态 度 . 奈 曼 本 人 终身 属于 频率 
学 派 ,但 他 不 大 参与 这 两 大 学 派 的 辩论 . 费 葡 和 尔 则 不 然 . 他 与 杰 莫 
里 斯 在 20 世纪 30 年 代 , 以 写 论文 一 应 一 管 的 形式 ,进行 了 长 时 间 
的 浴 论 ,由 于 费 融 尔 当 时 在 统计 界 执 牛 耳 的 地 位 而 其 对 手 久 不 是 
立 用 统计 学 家 ;他 的 舌 向 当然 影响 了 一 大 群 人 人 . 另外 ,20 世纪 上 半 
叶 正 是 频率 派 统 计 得 到 大 发 展 的 一 个 时 期 ,发 现 了 一 些 有 普遍 应 
用 意义 的 、 有 力 的 统计 方法 . 在 这 种 情况 下 ,人 人 们 不 会 有 感到 要 * 另 
可 出 中 "的 想法 . 自 20 所 纪 中 时 以 来 ,频率 派 统 让 学 的 发 展开 始 碰 
到 一 些 问题 ,如 数学 化 程度 人 意 来 愈 高 ,有 用 方法 的 产 出 相对 减少 ， 
小 样本 方法 缺 和 三 进展 从 而 和 急 来 盖 转 向 大 样本 研究 等 ,在 应 用 工作 
音 中 产生 了 了 不满. 在 这 种 背景 下 , 贝 叶 斯 统计 以 其 简单 的 操作 方式 
加 上 在 解释 上 的 某 些 合理 性 吸引 了 不 少 应 用 者 ,甚至 使 一 些 频率 
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派 统计 学 家 改 案 内 时 斯 派 , 也 就 是 可 以 理解 的 全， 

员 时 斯 统计 操作 上 的 简单 ,是 因为 它 有 一 个 锣 定 的 模式 : 乱 验 
分 布 十 样本 信息 之 后 验 分 布 ,而 这 一 转换 只 涉及 条件 分 布 的 计算 ， 
没有 原则 的 困难 ,不 像 在 频率 派 统 计 学 中 ,往往 磁 到 难于 处 理 的 摘 
样 分 布 问题 . 而 且 , 这 个 模式 的 解释 也 很 自然 , 它 符 合 人 们 试 识 事 
物 的 通常 程序 :在 原来 认识 5 先 验 分 布 ?的 基础 二 ,由 于 吉 了 新 的 售 
息 ! 样 本 ,而 使 我 们 修正 了 原来 的 试 识 , 它 体现 在 后 验 分 布 中 . 由 
叶 斯 统计 在 解释 上 的 合理 性 的 男 一 个 重要 之 点 是 :推断 的 精度 和 
可 靠 雇 是 “后 验 ?" 性 的 , 即 取决 于 所 得 样本 ,而 与 那 种 可 能 有 的 但 未 
真正 得 到 的 样本 无 关 . 频率 派 统 计 则 反 是 .在 这 种 统计 中 ,一 个 方 
法 的 可 靠 度 或 精度 ,在 获得 样本 之 前 已 定 下 ,与 获得 的 具体 样 李 匹 
天. 显然 ,前 一 种 性质 更 合乎 管理 而 易于 被 应 用 者 所 接受 . 

对 内 时 斯 党 派 来 说 ,有 -- 个 根本 的 难点 ,就 是 如 何 定 先 验 分 布 
的 问题 .前面 介绍 了 由 叶 斯 论 交 中 对 二 项 分 布 站 人 CN:0) 中 概率 
的 先 验 分 布 的 确定 过 程 .我 们 看 到 ,即使 在 这 样 一 个 相对 简单 的 情 
江 ,从 时 斯 也 花费 了 很 大 的 努力 去 论证 其 R(t0,1) 的 选择 ,和 明说 到 
底 这 种 论证 未 必 能 说 服 所 有 的 大. 可 以 想像 ,在 更 复杂 的 情况 下 ， 
这 个 问题 更 不 好 对 付 .20 世纪 抽 寺 斯 派 的 代表 信物 姓 理 这 个 问题 
的 基本 思路 ,就 是 引伸 册 时 斯 在 BCN,) 这 个 特例 下 的 想法 ,他们 
把 这 个 场合 下 贝 叶 斯 假设 RC(0,1) 称 为 无 信息 先 验 分 布 . 意 患 是 : 
既然 对 谷 数 8 之 什 录 对 一 无 所 知 , 那 么 设 定 的 先 验 分 布 ,就 应 避免 
林 能 的 颁 向 性 ;因而 包 会 的 关于 #8 的 信息 是 傅 少 愈 好 . 其 极端 情 
网 ,信息 少 刘 六 9, 就 是 无 信息 先 验 分 布 .但 这 是 一 个 模糊 概念 ( 信 
轧 如 局 量化 ,区 其 在 些 处 的 情况 ,难得 有 公认 的 合理 方法 ) ,不论 怎 
样 去 将 其 有 具体 化 :都 难免 会 有 不 尺 人 人 意 之 处 .事实 上 ,除了 在 位 置 
参数 和 刻度 参数 这 两 种 情况 有 比较 公认 的 可 算 满 意 的 取 法 ( 注 3) 
外 .其 他 场合 下 定义 的 所 谓 “ 无 信息 先 验 分 布 ". 都 只 有 一 种 * 谁 愿 
相仿 就 相 情 "的 唱 卑 . 例如 . 杰 弗 里 斯 为 避免 费 葡 尔 提 册 的 责难 
一 一 内 参数 取 法 不 同 而 导致 不 同 的 先 验 分 布 ,提出 了 一 个 法 则 ;用 
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下 (83yd8 作为 先 验 和 分 布 ,其 中 工人 的 为 费 软 尔 傅 息 量 ( 注 4). 这 在 其 
可 用 的 场合 的 确 避 免 了 费 区 尔 提出 的 问题 ,但 当 把 这 一 法 则 用 于 
一 项 分布 参 数 和 时 ,得 到 8 的 先 验 分 布 密度 为 [6(1 一 9)] -全 .作为 
无 信息 先 验 分 布 , 实 在 看 不 出 它 如 何 比如 ,1) 均 杀 分 布 更 合理 的 地 
方 . 

几 十 年 来 ,频率 学 派 和 上 贝 叶 斯 学 派 之 间 .进行 了 不 少 的 辩论 和 
驭 难 , 成 为 20 地 纪 数理 统计 学 舞台 上 一 个 引 人 大 注目 的 亮点 . 回顾 
其 中 的 经 过 ,一 方面 感到 这 种 辩论 有 其 益处 , 即 澄清 了 观点 和 深化 
了 认识 .对 两 猴 中 为 对 方 所 批评 的 要 害 所 在 及 其 所 根据 的 理由 ,看 
得 更 清楚 了 . 通过 辩论 ,对 各 派 的 优 缺 点 所 在 , 岂 有 了 一 个 比较 实 
在 的 估量 . 例如 频率 学 派 中 精度 和 可 靠 度 为 事前 设 定 而 不 取 据 于 
具体 样本 一 点 ; 确 与 通常 人 人 们 看 待 事 物 的 习惯 不 符 . 另 一 方面 ,不 
能 不 承认 ;经 过 多 年 论辩 ,分 歧 点 依然 如 故 , 没 有 看 出 在 哪 一 个 争 
执 点 上 双方 有 达成 共识 或 接近 的 情形 . 说 来 说 去 ,理由 也 还 是 原来 
那 一 些 . 

根本 之 点 在 于 :对 不 掌握 完全 信息 的 情况 下 归纳 推理 该 如 何 
做 ,尽管 人 们 可 以 在 若干 抽象 的 原则 上 取得 一 致意 了 底 (比如 ,最 明 
显 的 一 条, 就 是 任何 一 个 推理 系统 都 不 能 有 内 在 了 矛盾 ,都 必须 遵从 
形式 还 缉 的 基本 规律 等 ) ,但 钨 不 可 能 在 具体 的 推理 方法 上 取得 完 
全 的 一 致 . 比如 欧 氏 几何 与 罗马 切 夫 斯 基 几 和 何 ,其 公理 系统 有 很 党 
一 致 之 处 ,但 在 平行 公设 上 看 法 不 阳 , 徙 此 各 发 展 成 为 一 个 逻辑 上 
站 得 件 脚 的 体系 . 如 果 一 定 要 争论 谁 比 谁 优 ,是 钨 对 得 不 出 人 人 都 
接受 的 结论 的 . 

频率 学 派 与 贝 叶 斯 学 派 之 争 与 此 有 些 相 似 . 两 派 其 实 有 不 少 
的 共同 点 ,例如 都 承认 样本 有 概率 分 布 ,概率 计算 遵守 共同 的 规则 
等 . 分 歧 在 于 把 未 知 参 数 8 看 成 一 个 未 知 的 固定 其 呢 ,还 是 看 成 -一 
个 随机 变量 . 其 余 的 分 歧 都 多 少 由 此 派生 而 来 . 这 两 派 都 建立 了 在 
逻辑 上 能 自 彻 其 说 的 体系 ,它们 可 以 说 是 两 股 道上 的 车 ,用 一 个 的 
理念 去 批评 另 一 个 ,不 会 有 结果 . 这 不 是 反对 对 这 类 问题 进行 探 
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汪 , 而 是 说 应 有 一 个 开放 的 心态 . 当 坚 持 目 己 的 信念 时 , 灌 了 共 对 方 
的 观点 并 非 虚 妄 , 有 其 考虑 的 胡麻 ,不 能 站 在 一 派 的 立场 上 去 批评 
另 一 沽 的 得 失 .， 

美国 有 一 位 统计 学 家 伯 刘 尔 写 了 一 本 # 统 计 雇 策 理 论 》 的 书 . 
在 序言 中 他 说 ,在 开始 写作 时 ,他 原 是 打算 对 各 派 取 不 抱 仿 见 的 态 
度 , 但 随 著 写作 的 进展 ,他 成 了 一 个 “狂热 的 贝 吁 斯 深 ”. 理由 是 他 
逐渐 认识 到 ,只 有 从 内 叶 斯 观点 去 看 问题 ,才能 最 终 显 示 其 意义 . 
他 提出 大 们 对 由 叶 斯 观点 的 两 条 批评 ,一 是 由 于 选择 了 不 正确 的 
先 验 分 布 而 得 出 很 坏 的 结果 ,一 是 贝 叶 斯 方法 缺乏 客观 性 . 对 前 一 
条 批评 他 至 今 尚 认为 是 一 个 问题 ,而 对 后 一 条 则 进行 了 反 驶 , 建 由 
是 频率 派 的 方法 也 是 某 一 先 验 分 布下 的 内 叶 斯 方法 ,其 对 先 验 分 
布 的 (无 意识 的 选择 ,并 不 见得 比 贝 叶 斯 派 更 客观 . 可 是 不 要 记 
记 , 轿 率 学 庶 中 的 多 数 常 用 方法 ,其 背后 的 先 验 分 布 正 是 员 叶 斯 派 
所 主张 的 那 种 “正确 ”选择 ,如 无 信息 先 验 分 布 . 你 要 说 是 频率 派 实 
奈 上 也 用 了 贝 叶 斯 方法 ,他 何尝 不 可 以 说 你 贝 叶 斯 小 用 了 他 频率 
产 的 方法 . 更 根本 的 是 ;频率 方法 的 做 稻 性 是 建立 在 未 知人 参数 固定 
非 随机 这 个 基本 观点 上 ,如果 你 员 计 斯 方法 能 在 这 个 基本 点 的 前 
提 下 把 频率 派 比 下 去 , 那 才 能 使 人 信服. 若 不 能 做 到 这 一 点 , 则 各 
有 各 的 标准 .一 切 免 谈 . 所 谓 “ 只 有 从 贝 叶 斯 观点 看 问题 才 有 最 统 
意义 ”, 也 只 能 看 作 是 一 种 表态 的 声明 . 

但 最 后 还 有 一 个 至 高 无 上 的 裁判 者 , 即 实 用 效果 . 统计 方法 无 
论 柱 学 埋 上 如 何 精细 高 明 , 总 去 能 以 见 诸 实 效 为 贵 . 千 今 为 止 ,这 
个 裁判 给 这 两 派 打 的 分 都 不 低 . 也 正 是 因为 它们 在 应 用 上 总 的 说 
部 有 良好 的 表现 ,才能 各 自 聚 合 其 追随 者 . 当然 ,有 一 个 在 什么 情 
沁 下 什么 方法 更 为 方便 合用 的 回 题 . 如 在 某 些 参数 模型 且 样 本 量 
不 大 的 情况 , 贝 呈 斯 方法 避 开 了 寻求 抽样 分 布 这 个 麻烦 ,应 用 上 可 
能 比 频 率 方法 要 方便 ,而 在 非 参数 模型 下 , 先 验 分 布设 定 不 易 , 频 
率 学 派 的 方法 就 下 能 更 方便 些 . 

这 种 卷 漠 不 三 成为 比较 两 广 优 劣 的 理由 . 正好 相反 ,这 说 明 二 
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者 应 是 一 种 补充 的 关系 :作为 一 个 统计 党 家 ,我 可 以 不 执 闭 于 任何 
一 族 的 观点 ,而 是 各 取 其 所 长 ,为 我 所 用 . 相信 一 般 掀 春 开 放心 态 
的 统计 学 者 密 是 采取 这 种 态度 ,认为 到 什么 时 候 某 一 汽 会 主导 整 
个 统计 学 ,这 种 看 法 至 少 在 目前 还 看 不 出 有 成 为 现实 的 可 能 ， 


$ 3.8 经 验 贝 叶 斯 方法 


汉 验 内 叶 斯 (Empirical] Bavesian, 简 记 为 EB) 方 法 是 美国 现 
代 统 计 学 家 罗 宾 斯 (H.Robbins}) 在 1955 年 提出 的 一 种 方法 . 在 起 
初 ,他 这 个 思想 曾 受 到 统计 界 一 定 的 重视 ,被 认为 是 企图 海通 这 两 
大 学 添 的 一 种 努力 .有 的 学 者 ,如 奈 显 ,由 把 这 个 方法 称 为 统计 学 
上 的 "一 个 突 酸 **. 

前 已 指出 ; 见 叶 斯 统计 的 一 个 为 人 垢 病 之 点 ,在 于 定 先 验 分 布 
无 章 可 循 , 有 相当 大 的 主观 随意 人 性 .但 是 ,如 果 某 一 问题 曾 反 复出 
现 并 在 历史 上 记录 有 资料 , 则 这 种 资料 中 应 包含 有 关于 尘 验 分 布 
的 信息 ,因而 可 以 利用 . 这 样 , 见 叶 斯 方法 也 就 植 根 于 实际 经 验 之 
,而 非 人 了 戎 的 主观 产物 .上述 思 想 就 是 罗 窒 斯 方法 的 出 发 点 ， 

可 以 举 一 个 形象 的 例子 . 某 工 厂 生 产 一 种 产品 ,其 按 目 计算 的 
不 合格 品 率 6, 由 于 随机 的 原因 ,逐日 有 所 波动 . 在 此 情况 下 ,可 以 
说 9 是 一 个 有 一 定 分 布 f 的 随机 变量 ,fF 也 就 是 8 的 先 验 分 布 ,但 
亡 是 未 车 的 , 现 设想 该 三 为 估计 当日 产品 的 不 合格 品 率 , 从 当日 的 
产品 中 抽取 NN 个 , 测 得 不 合格 品 有 羡 个 .假定 该 厂 作 这 柏 事 已 有 
了 很 长 一 段 时 间 , 积 累 了 资料 于 ,,… ,到 sw, 它 们 分 别 包 含 了 各 该 日 
不 合格 癌 率 和 eu 的 信息 .而 如 ,Bw 是 先 验 分 布 FF 的 随机 
样本 . 这 样 一 来 ,既往 的 资料 六 ,… ,Xs 就 包含 有 关于 先 验 分 布下 
的 信息 ,可 议 在 和 销 计 8 中 加 以 利用 . 就 是 说 ,车 当日 抽查 的 入 个 产 
三 中 有 六 个 不 合格 的 , 则 在 拓 计 当日 的 不 合格 电 率 8 时 ,我 们 不 

66 


单 使 用 臣 , 还 轨 把 既往 资料 下, ,…,Xw 也 用 上 ,上 且 的 是 使 我 们 能 更 
接近 在 天 已 知 时 真正 的 贝 时 斯 解 , 这 就 是 EH 方法 . 其实, 这样 的 
思维 方法 在 日 常生 活 中 也 很 常见 . 鲍 如 , 某 一 选手 在 当前 这 次 大 赛 
中 表现 不 佳 . 但 当 我 们 对 这 一 选手 的 水 平 作 出 评估 时 ,我 们 不 止 注 
意 到 他 在 当前 这 次 太 赛 中 的 表现 .还 可 参考 他 在 历史 上 名次 重要 
比赛 中 的 表现 . 

其 实 ,EB 方法 从 实质 上 说 是 一 种 频率 学 派 的 方法 ,与 贝 叶 斯 
统计 无 涉 ,如 果 某 -一 个 污 验 分 布 有 一 种 实际 的 或 经 验 的 根据 (如 在 
上 述 不 合格 品 率 的 例 中 那样 ), 那 么 一 切 玫 可 以 归 入 频 讲 学 派 的 罗 
道内 去 解释 ; 面 六 时 斯 学派 与 频率 党 派 的 根本 相 异 之 点 ,不单 在 于 
其 推理 模式 

完 验 分 布 十 样本 信息 六 后 验 分布 
在 形式 上 与 频率 学 派 之 不 同 , 还 在 于 其 先 验 分 布 是 在 主观 意义 上 
解释 的 ,以 及 由 此 派生 的 一 个 重要 事实 ;所 有 的 概率 计算 都 是 在 参 
家 空间 万 进行 ,个 容 纤 有 涉及 样本 分 布 的 概率 计算 ， 对 这 些 特点 ， 
E 上 吕方 法 一 点 也 不 有 具备. 

从 这 几 十 年 数理 统计 学 发 展 的 情况 看 ,EB 方法 起 的 影响 不 
如 当初 期 每 的 那么 大 . 原因 一 则 由 于 这 方法 要 求 的 条 件 高 ,再 则 还 
有 一 个 解释 的 问题 . 还 是 拿 鞋 面 那个 不 人 台 格 品 率 的 例子 来 说 明 . 设 
已 有 了 了 婚 往 的 资料 天: 加 w 现 在 当日 抽取 六 件 产品 发 现 其 中 
不 合格 品 有 六 个. 如果 芭 很 大 ,这 完全 可 以 是 因为 ,当日 由 于 某 种 
临时 上 几 原因 ,导致 趟 合格 曲率 大 大 增加 . 这 一 点 在 一 个 一 般 讲 情况 
较 好 的 工矿 中 ,也是 会 偶尔 出 现 的 .一定 要 通过 参考 以 往 的 记录 而 
把 它 调 抵 一 些 , 不 见得 合理 . 因为 我 们 在 此 所 注意 的 ,不 是 该 厂 总 
时 (或 长 出 间 平均 的 ;表现 如 何 ,而 是 其 当日 的 表现 如 和 何 ,如 同一 个 
选 于 ,他 当日 表现 坏 与 其 以 往 平 均 表 现 较 好 ,并 不 天 盾 ， 


注 1; 认 时 斯 相合 性 的 证 明 . 
中 六 记 参 数 真 值 , 作 N 次 现 赛 ,事件 出 现 环 次. 接 中 心 极限 
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定理 , 任 给 ?0, 存 在 五 人 0, 便当 ww 充分 大 时 有 


PaiR— NG NBI>1—7. {Al1) 
代 上 阔 在 世间 | 站 一 二 和 人 站 个 给 ， 风 | 
落 在 区 间 [4 一 一元 - 祭 ] 内 ， 是 一 个 给 定 的 数 , 则 
在 范 转 
| 
XN—Ne, vv NB, ,| A? 
] | | J (A2) 


内 ,有 | 了 一 NO, | 过 wN (CA 十 B). 因此 , 按 二 项 分 布 的 正 杰 逼近 ,对 
范围 CA2) 内 的 是 和 8, 当 NWN 一 o5 时 一 至 地 有 


站 车 T _ 1 (XO NG) 
Cx ‘1 0) | 由 iexp| NOC Oy 
A 及 1 一 于 
二 一 一 | 119 二 -< 
> [2zN| 0 十 元 儿 1 » 入 | ) 
XD | i: 过 
2N| 00— 2 [1 一 % 一 一生 ;| 
VN VN 
其 中 Idi 所 wNB. 现 有 
Bn FE 
六 二 CNTDCI| 0 — xd 
Bt 
> (N+) FC — 0)*-xq0, (Ad 
2 一 一 二 


当 NN 充分 大 时 ,由 (A37?.(A4) ,得 


A A 
D>N+D 2rN| G+) |1-%+ |) Ix. 
(A5) 
其 中 
六 [NOG — 8) dk 
= exp oe] 6 


| 


1 入 j 一 -有 是 


本 1 | 
| ,exXPT 5 《9 十 J ay. 


NN 
由 于 一 < 过 B, 有 
vN 
1 
网 A 2 
: -- 洁 fo 一 一 一 一 [1 一 0 一 -六 | | 。 
TN (| pd -专用 2 
AG) 
取 1 充分 大; 使 
| ce- 和 dy 之 v2 一 从， 
[dd- BB} 


6 一 0 给 定 .给 合 (A5) 一 (A7) 可 知 , 对 (A2) 范 鲁 内 的 外, 当 和 N 元 分 
大 时 一 致 地 有 


FPCN+I)f2nxl| + | 1 一 4 十- 


他 
Vr 
由 于 6>>0 及 #7>0 的 任意 性 , 即 证 明了 所 要 的 结果 . 


lim inf 1T', 之 1 一 


注 2: 证 明 R60,1) 是 惟一 满足 (1}) 式 的 先 验 分 布 ， 
说 先 验 分 布下 满足 (1) 过 , 则 有 


| ci NAIFOO) = CN 1) ,R01,N. 


CAB) 
很 定 ‘A8) 对 所 有 的 自然 数 NN 都 成 立 . 在 (A8) 式 中 令 三 一 六 ,得 
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| “dF (9) -一 Ci 十 17 所 一 ,2 (AI9Y 
这 表明 :分 布下 的 和 N 阶 和 窍 为 (N 十 1) ',N 二 1,2,…. 因 为 


NN 
个 ; 即 下 一 RC0,1); 这 证 明了 所 要 的 结果 . 

不 过 ,上述 推理 中 有 一 个 要 紧 之 钼 ,; 即 雪 求 (A8) 式 ,或 至 少 
[9) 式 ,对 一 切 自然 数 成 立 ; 而 在 一 个 具体 问题 中 ,NN 是 一 定 的 . 
当 N 国定 时 ,满足 (A8) 的 分 布下 确实 不 止 一 个 . 这 可 以 证 明 如 
下 : 找 N 十 1 阶 甸 项 式 Pt9) ,满足 条 件 

| ope0)de — 0, 7 二 0.1 ,NV. CA10) 


这 种 多 项 式 必 存在 . 记 mm 二 min 已 (9). 服 

五 【一 1 十 | 到 p08), 站 < < ] ， 
则 中 为 10,1] 上 的 概率 密度 , 且 由 (A10) 可 知 它 满足 (4A8) ,因而 
RD1) 不 是 满足 41) 式 的 惟一 的 先 验 分 布 . 


注 3: 在 数理 统计 学 的 理论 和 应 用 上 ,有 两 类 分 布 族 棚 为 重 
要 . 一 是 位 置 参 数 族 ,其 概率 密度 有 形式 (x 一 从 :一 co 和 oo0， 
其 中 x) 为 一 个 概率 密度 . 它 是 由 度量 诛 点 的 变动 而 产生 的 分 布 
族 , 因 为 ,和 镍 总 一 fT) ,; 则 十 8 一 了 tz 一 各 . 男 一 个 是 刻度 参数 族 ， 


其 概率 密度 有 形式 6.'f| 各 | ,90,f 为 一 概率 密度 , 它 是 由 度量 


单位 的 变动 而 产生 的 分 布 族 . 因为 车 x 一 (x), 则 or~0-1f| 人 |. 

对 位 置 参 数 族 ,因原 点 位 置 9 不定,X 落 在 等 长 区 间 内 的 概率 
应 当 相 同 . 由 此 出 发 ,在 一 定 条 件 下 ,可 以 证 明 ;6 的 无 信息 先 验 分 
布 是 在 全 直线 上 有 常数 密度 的 分 布 . 因为 当 c>0 时 有 | ”4ad9 = 
~ ,这 不 是 一 个 正常 的 概率 分 布 . 在 统计 学 上 称 为 广义 先 验 分 布 . 


对 刻度 参数 族 , 由 于 刻度 不 定 , 基 落 在 区 间 [a;,# 内 的 概率 ,只 应 与 
iD 


比值 二 有 关 . 由 此 出 发 .在 一 定 的 条 件 下 ,可 以 证 明 :8 的 无 信息 先 


验 分 布 有 密度 8 !( 当 89>0) ,这 也 是 一 个 广义 先 验 分 布 . 

这 两 个 简单 例子 也 反 且 了 * 无 信息 先 验 分 布 "这 个 概念 的 内 在 
困难 ;即使 在 这 么 简单 而 重要 的 情况 下 ,也 找 不 到 正常 意义 下 的 先 
验 分 布 . : 


注 4; 杰 弗 里 斯 确定 先 验 分 布 的 原则 . 

考虑 一 个 简单 的 情况 ,样本 芒 有 人 分布 Fr 的 dr 参数 六 属于 
的 一 个 区 间 7. 取 新 基数 J 一 gt96),g'(8}) 在 /上 上 话 续 且 不 为 0， 
于 是 也 人 可 议 取 由 为 参数 . 杰 弗 里 斯 的 问题 是 ,要 怎样 去 取 6 的 先 验 
分 布 , 才 能 使 它 在 这 种 变换 下 保持 不 变 . 回答 是 :应 取 广 (8)d9 为 
先 验 分 布 ,其 中 


I (0)=E| | | gf | fr, dr 


为 费 砍 尔 信 息 量 ， 
设 我 们 取 新 参数 一 g (9). 有 8 二 有 (V8) ,hh 为 g 的 反 函 数 .对 新 
参数 则 ,样本 分 布 为 fr jdur ,其 费 歇 尔 信息 量 为 


tp)— | | 7 


按 所 给 原则 ,对 参数 &% ,应 取 先 验 分 布 Ti Cy)dy. 因此 ,为 证 不 变 
性 ,只 须 证 明 : 在 变换 5 二 g(8)[ 或 9=h(g) 一 样 ] 下 ,分 布 (gd 
正好 转换 到 三 (9)d8. 这 等 于 要 证 明 

TiFgt0) Je'(0) =1t(0). (A11) 


| f Cz,h(p) dz 


位 i 
， 


~ ， ] , 
Tgt0) = | [ee 


[aD) ?|g ew flesh gt 8) ) Jdx. 


y= 


+1 


| ae 1 
注意 到 hh(g60)) 二 9, (1 — = ny ;有 


一 ， 也 
7T[gt8)] 一 | 8 [a C0) f(r de 


~—I(0)[e' (9) 1 :, 
由 此 得 到 A1l11l). 


fe 


第 四 章 ”最 小 二 乘法 


$4.1 从 算术 平均 谈 起 


有 一 个 说 法 可 能 是 绝 太 多 数 人 都 能 同意 的 :在 成 百 上 干 的 各 
太 扣 类 统计 方法 中 , 取 算 术 平 均 呈 最 为 大 所 知 , 使 用 最 广 的 方法 ， 
统计 学 家 前 说 的 一 名 口头 禅 是 共事 从 统计 观点 看 如 何如 司 ,这 “ 统 
计 驱 总 ” 作 狂 六 一 后 的 解释 ,就 是 平均 观点 . 凡事 都 有 例外 ,例如 
吸 燃 有 害 健康 ,但 确 志 有 吸烟 者 的 健康 优 于 不 吸烟 者 的 现 子 . 统计 
尝 家 对 此 的 回答 是 ,平均 说 来 " ,不 吸烟 的 健康 优 于 吸烟 者 . 例外 
情况 的 入 在 ;在 侣 于 用 统计 观点 看 问题 的 人 人 来 说 ;是 题 中 应 有 之 
义 .天 不 如 此 ,统计 科 掌 也 就 汕 有 必要 存在 了 . 

以 上 是 从 实际 的 屋面 讲 . 如 果 我 们 从 理论 的 角度 也 走 一 点 极 
端 , 旭 可 以 说, 一 部 数理 统计 学 的 历史 ,就 是 从 纵横 两 个 方向 对 算 
术 平 均 进 行 不 断 深 人 的 研究 的 历史 , 铁 的 方面 指 平均 值 本 和 访 . 伯 努 
利 及 其 后 从 多 的 太 数 律 、 狄 菜 弗 一 拉 普 拉 斯 中 心 极限 定理 ,高 斯 的 
正 态 旋 差 理论 ,这 些 在 很 大 程度 上 可 视 为 对 算术 平均 的 研究 成 果 ， 
如 今 成 了 支撑 数理 统计 学 这 座 大 厦 的 支柱 . 20 世纪 以 来 数理 统计 
学 理论 化 的 程度 加 深 , 不 浙 提 出 有 关 算 术 平 均 的 深刻 问题 ,有 的 至 
今 尚 未 完全 解决 . 
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除 算术 平均 外 ,在 统计 方法 中 处 于 次 一 位 重要 地 位 的 量 是 方 
关 ( 标 准 莽 ), 但 方差 不 具备 平均 值 所 有 的 独立 品 档 , 它 在 很 大 程度 
上 古 因 平均 值 精度 研究 的 需要 而 引进 . 

从 机 的 方向 看 ,是 指 有 许多 统计 方法 ,看 似 与 算术 平均 很 不 
同 ,但 从 某 种 意义 上 看 ,是 算术 平均 思想 的 发 展 . 其 中 最 重要 的 一 
项 加 点 到 本 章 的 主题 一 一 最 小 二 乘法 . 

算术 平均 是 解释 最 小 二 乘法 的 最 简单 的 例子 . 没 对 某 个 未 知 
量 台 和 旭 复 作 n 次 测量 ,结果 记 为 zx 想 要 利用 这 些 测 量 值 对 
9 作 - 一 估计 .推理 如 下 : 设 真 作 为 4, 则 测量 值 zx, 的 误差 为 : 

EO 1] yn. 

因为 测量 值 应 在 真 值 附近 , 故 一 般 说 来 , 当 a 确 为 真 值 时 ,|e,|， 
| 颂 向 于 到 小 什 ,否则 就 大 -- 些 .这 让 示 了 以 下 的 作法 : 令 


了 一 dle 一 Scr 一 如] ， 
找 .使 上 ta}) 杰 到 最 小 . 容易 算出 ,使 (a) 于 到 最 小 的 a 值 ,下 是 


、 
本 


十 13 ”9 省 的 算 木 平均 r= 一 


使 误差 平方 和 达到 最 小 以 寻求 估计 值 的 方法 ,就 叫做 最 小 二 
滋 荡 .上 了 基 小 二 乘法 得 到 的 估计 , 叫 最 小 二 乘 佑 计 . 当然 , 取 平 方 和 
作为 目标 少数 只 是 众多 可 取 的 方法 之 一 . 例如 也 可 以 取 误 差 4 次 
方 和 或 绝对 值 和 . 取 平 方 在 计算 上 有 简便 的 优点 ,理论 上 也 有 其 优 
坊 性 ,因此 成 为 一 个 普遍 采用 的 选择 . 

虐 面 不 用 最 沾 二 乘法 来 解释 算术 平均 . 我们 也 可 以 把 推理 反 
过 来 看 . 由 于 算术 平均 是 一 个 历经 于 百年 考验 的 方法 ,故此 一 个 一 
般 方 法 如 果 是 合理 的 , 它 理应 在 重复 测量 这 个 情况 下 导出 算术 平 
均 . 最 小 二 泣 法 具有 这 一 特性 ,使 我 们 对 其 合理 性 增添 了 信心 . 这 
种 推理 是 循环 的 :以 四 证 乙 , 以 乙 证 甲 . 在 还 辑 上 自 不 足 取 , 但 从 实 
际 角 度 看 不 能 说 没有 一 定 的 道理 . 事实 上 这 正 是 商 斯 在 建立 正 恋 
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误差 理论 中 的 基本 一 环 ( 见 第 五 草 》. 

最 小 二 乘法 的 一 般 形 式 可 表述 为 ; 

目标 函数 一 >》, (观测 值 一 理论 值 ). 

和 导 台 也 可 以 是 积分 . 理论 值 根据 设 定 的 模型 计算 ,其 中 省 有 未 知 
参数 ,其 值 以 “目标 函数 达到 最 小 ”的 准则 来 估计 之 . 按 此 ,最 小 一 
乘法 不 过 是 如 同 插值 法 之 类 的 一 种 计算 方法 ,其 与 统计 学 能 发 生 
关系 ,是 因为 珊 测 值 有 随机 误差 因此 最 小 二 莱 渤 与 误差 论 有 和 密 殷 
的 美 系 . 

历史 上 一 般 都 把 最 小 二 乘法 的 发 明 与 高 斯 的 名 字 联 系 起 来 . 
但 第 一 个 用 书面 形式 公开 发 表 这 个 方法 的 ,是 法 国 数 学 家 勒 让 德 ， 
时 间 是 1805 年 ,而 高 斯 的 有 关 著 作 发 表 于 1809 年 .发明 这 个 方法 
的 动 国 ,是 天 文学 和 测 地 学 上 钼 理 数 据 的 需要 .以 后 这 个 方 活 涂 人 
统计 数据 分 析 的 领域 ,对 统计 学 的 发 展 产 生 了 和 便 太 的 影响 . 统计 史 
家 对 此 评价 很 高 ;有 的 认为 最 小 二 乘法 之 于 数理 统计 学 , 狐 如 微 积 
分 之 于 数学 . 有 的 学 者 称 最 小 二 科 法 是 19 世纪 统计 学 的 “中 心 主 
题 ”. 


$ 4.2 勤 让 德 以 前 的 有 关 研 帘 


天 文 和 测 地 学 中 的 一 些 数据 分 析 问 题 可 以 描述 如 下 :有 若干 

个 我 们 宅 要 和 估计 其 值 的 量 8 人, 胃 有 寿 于 个 可 以 测量 的 量 -放血 
按理 论 , 这 些 量 之 间 应 有 线性 关系 

Xo 二 Td. 2) 

但 是 ,由 于 在 实 昧 工作 中 对 x,,… ,xz 的 量 测 不 免 有 误差 ,加 上 关 

系 (2) 可 能 本 来 就 只 是 数学 上 的 近似 而 非 姑 格 咸 立 ,(2) 式 左边 的 

表达 翅 实 际 上 不 为 0, 其 实际 值 与 量 测 有 关 ; 可 视 为 一 种 误差 , 现 

设 进行 了 a 次 观测 ,n>, 在 第 i 次 观测 中 ,zx,,… ,工分 别 取 值 zu， 
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有 

zw 十 十 一 十 全 二 0 17 一 1 (3) 
纽 江 ”一 天 , 则 一 般 由 方程 组 537? 林 惟一 地 解 出 向 及 之 值 , 可 以 
就 取 它 们 作 汐 名,…* ,的 估计 值 . 当 n 守 时 该 如 何 办 ?如 果 (3) 式 
十 严 格 成 立 的 ; 则 愉 杰 从 这 个 方程 中 和 任 挑 出 友 个 去 解 就 行 . 但 如 
上 所 述 ,由 于 所 讲 的 原因 ,(3) 式 实际 上 并 非 严 格 成 立 , 因 此 ,到 不 
同 的 上 个 方程 可 能 解 出 不 同 的 结果 . 在 实际 问题 中 ,总 有 是 大 于 甚 
至 是 远大 于 上 ;这 样 多 提供 一 点 数据 信息 ,以便 对 未 知 参 数 册 ，……， 
9 作出 较 精 的 合计 . 这 就 是 当时 的 天 文 和 测 地 学 家 面临 的 数据 分 
析 问 题 .下面 的 例子 很 著名 , 它 是 勒 让 德 在 发 明 最 小 二 恢 法 时 所 涉 
如 的 问题. 

地 球 缠 丙 北极 的 轴线 自转 , 因 离 心力 的 作用 ,地 球 并 非 一 个 正 
圆 球 ,而 是 咯 有 粒度 . 由 于 这 个 原因 ,经 线 上 一 度 的 弧 长 ,应 随 其 纬 
度 的 升 高 而 增加 . 着 以 i() 记 以 纬度 8 之 点 为 中 心 的 经 绕 上 一 度 
的 强 长 ;是 以 证 明 ( 注 17 近似 地 有 

[0) =—8, 0,sin’g. (C4) 
分 别 令 0 和 90", 可知 中 的 意义 有 是 :赤道 处 一 点 为 中 心经 线 上 
一 度 的 又 长 ;而 二 十 品 则 是 极点 朴 为 中 心经 线 上 一 度 的 弧 长 . 因为 
上 和 (9) 在 选 定 的 适当 处 所 便于 量 测 ,(4) 可 以 妇 人 模型 (2)( 取 rr 
一 一 TI 一 1 一 Sn 0D) .证 下 疡 .上 交 后 就 可 以 定 下 上 5 的. 可 证 
‘ 注 27: 整 个 经 线 之 长 等 于 360，ff45"). 勒 让 德 参 加 的 就 是 测量 
通过 巴黎 的 经 线 长 的 工作 , 此 工作 始 自 1892 年 ,在 #* 一 5 处 地 点 量 
测 了 8 和 和 19). 

下 而 米 谈 谈 勒 让 德 之 K 况 的 几 个 实 俩 的 处 理 . 为 节省 篇 幅 , 略 去 
了 了 有关 问题 的 技术 细节 的 撕 述 . 

在 海上 航行 的 船只 的 定位 ,是 一 个 重要 问题 . 早 在 18 世纪 初 ， 
通过 己 星 去 确定 船 的 纬度 已 有 了 相当 的 精度 ,但 确定 经 度 的 问题 
则 更 国难 .1750 年 ,天 文学 家 梅 耶 发 表 了 一 种 方法 ,该 法 六 及 月 面 
上 上 某 些 定点 位 置 的 现 测 . 对 我 们 此 处 有 关 的 是 ,他 得 到 一 个 包 售 3 
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个 未 郑 数 的 形 如 (1 的 关系 式 , 但 一 共有 27 组 观测 数据 . 为 从 所 得 
的 27 个 方程 中 解 出 那 3 个 未 知 参 数 . 梅 耶 把 它们 分 成 3 组 ,每 组 
9 个 .把 每 组 内 的 9 个 方程 相 加 ,得 到 一 个 方程 . 这 样 共 得 3 个 方 
轻 , 可 以 解 出 3 个 未 知 数 .至 于 分 组 的 方法 , 梅 耶 是 以 其 中 一 个 又 
次 为 淮 ; 按 各 方程 中 此 系数 的 大小 分 组 :最 大 的 9 个 ,最 小 的 9 个 
和 剩 下 的 8 个 各 成 一 组 .在 最 小 二 乘法 发 明之 前 , 梅 耶 这 个 方 潜 痊 
比较 菠 行 并 袖 冠 以 他 的 名 字 . 梅 取 认为 ,就 此 例 而 言 , 这 种 作法 得 


出 的 解 ,其 误差 较 之 任意 选 3 个 方程 求 出 的 解 的 误差 ,只 有 六 = 
1 | . 1 1 
寺 那 么 大 . 我 们 知道 这 一 论点 不 正确 ,正确 的 说 法 应 是 -一 3 


《参看 第 二 章 ). 值得 一 提 的 是 ,梅子 还 试 狗 对 其 解 的 误差 界限 作 一 
佑 计 . 虽然 如 今 看 来 他 用 的 方法 颇 案 不 正确 之 处 ,但 他 在 那么 早 的 
阶段 能 作出 这 种 努力 ,是 难得 的 . 

主星 和 本 尾部 是 太 附 系 的 大 行星 . 由 于 吸力 而 对 各 自 的 运动 
转让 产生 的 影响 ,是 18 世纪 中 许 密 天 文学 家 和 数学 家 关心 的 间 
题 ,其 中 包括 像 欧 拉 和 拉 普 拉 斯 这 样 的 大 学 者 . 他 们 的 方法 不 同 ， 
但 都 是 引导 到 一 个 形 如 (2) 式 的 关系 式 , 要 通过 观测 数据 求解 , 欧 
拉 在 1749 年 得 到 的 方程 包含 8 个 未 知 数 ,共有 在 160 年 期 间 通 过 
观察 得 到 的 75 组 数据 , 即 在 (3) 式 中 在 一 8 一 75. 欧 拉 求解 的 作 
法 很 痛 特 而 繁 元 ;不便 在 此 细 述 . 作为 求解 矛盾 线性 方程 组 的 方 
法 ,他 的 做 法 显得 兴 乱 无 章 , 缺 往 基 本 的 合理 性 ,只 能 认为 是 一 次 
失 吏 的 努力 . 

拉 普 拉 斯 也 研究 了 这 个 间 题 . 他 在 1787 年 得 到 - :个 形 如 (3) 
式 的 方程 组 ,其 中 站 = 二 4,n 一 24. 和 拉 普 拉 斯 求解 的 方法 与 梅 耶 相似 ， 
他 要 从 这 24 个 方程 中 化 出 4 个 方程 ,以 便 解 出 4 个 未 知 参 数 . 具 
体 作 法 是 ; 先 把 24 个 方程 编导 ,然后 ， 

芝 一 个 方程 ;24 个 方程 之 和 ;， 

第 二 个 方程 :前 12 个 之 和 一 后 12 个 之 和 ; 
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第 三 个 方程 :( 编 号 为 3.4,10,11,.17.18 的 方程 之 和 ) 一 
(编号 为 1,7,14,20 的 方程 之 种); 
第 四 个 方程 :( 编 导 为 2,8,9,15,16,.21,22 的 方程 之 和 ) 一 
(编号 为 5.6,12.13.19 的 方程 之 和 ). 
拉 普 拉 斯 没有 解释 如 此 组 合 的 原因 . 因 之 ,与 欧 拉 的 方法 相似 ,其 
方法 没有 显示 如 何 应 用 于 类 伺 问 题 的 途径 . 与 梅 耶 的 方法 相 比 , 拉 
普 拉 斯 的 作法 有 一 个 特点 , 即 同 一 个 方程 可 以 被 使 用 几 次 ,例如 编 
号 1 的 方程 用 在 前 3 个 方程 的 构 作 中 . 这 一 点 与 勤 让 德 的 最 小 二 
乘法 相似 ,但 不 能 认为 这 是 向 勒 让 德 的 方法 靠近 了 一 步 ， 
附和 人 寻味 的 是 ,以 栈 拉 和 拉 首 拉 斯 这 样 的 顶级 大 学 者 ,一 生 不 
开道 解 次 了 多 少数 学 难题 , 却 对 于 解 线 性 矛盾 方程 组 这 样 一 个 看 
来 并 非特 别 深奥 的 问题 ,没有 守 乏 建树 . 一 个 可 能 的 原因 是 :他 们 
习惯 于 求解 那 种 提 法 严谨 的 数学 问题 ,而 求 解 色 性 矛盾 方程 组 不 
属于 这 种 问题 . 它 提 法 沾 确定 ( 管 么 叫 解 ,没有 定义 ), 本 质 上 是 一 
个 实用 性 的 数据 处 理 问 题 ,需要 一 点 新 思维 . 勒 让 德 的 成 功 在 于 他 
从 一 个 新 的 角度 来 看 待 这 个 问题 ,他 不 像 上 述 诸 人 那样 致力 于 找 
出 几 个 方程 (个 数 等 于 未 知 数 的 个 数 ) 再 去 求解 ,而 是 考虑 误差 在 
整体 上 的 平衡 , 即 不 使 误差 过 分 集中 在 几 个 方程 内 ,而 是 让 它 比较 
均匀 地 分 布 于 各 方程 . 这 个 考虑 使 他 采取 使 


> (AT; 十 Te 十 | 十 Te 一 最 小 《5 ) 
1 一 上 


的 原则 去 求解 bm :及 . 这 个 例子 也 启示 我 们 ,在 科研 中 观念 上 的 
平 新 和 突 玻 是 如 何 的 不 容易 .一 经 勒 让 德 点 破 , 我 们 会 感到 事情 是 
理 了 所 当然 .但 在 没有 发 现 以 前 ,许多 大 学 者 努力 了 几 十 年 也 无 功 而 
到 . 
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§ 4.3 勒 让 德 发 明 最 小 二 乘法 


勒 让 德 是 法 国 太 数学 家 ,在 数学 的 许多 领域 ,包括 实 圆 积分 ， 
数论 和 几何 等 方面 ,都 有 重大 的 贡献 .最 小 二 乘法 量 先 出 现在 他 于 
1805 年 发 表 的 一 本 题 为 & 讨 算 划 性 轨道 的 新 方法 》 的 著作 的 附录 
中 . 该 附录 占据 了 这 本 长 80 页 的 著作 的 最 后 3 页 . 勒 让 德 在 这 本 
书 前 面 凡 十 页 关于 厅 星 轨道 计算 的 讨论 中 没有 使 用 最 小 二 乘 蕉 ， 
可 上 抑 在 他 刚 开 始 写 作 时 ,这 一 方法 尚未 在 他 头脑 中 成 形 . 历史 资料 
还 才 上 六 , 勒 让 德 在 参加 量 测 过 巴黎 子 年 线 长 这 项 工作 很 久 以 后 还 
末 发 更 这 个 方法 .考虑 到 此 书 发 表 于 1805 年 旦 该 法 出 现在 书 尾 的 
附录 中 .可 以 推测 他 发 现 这 个 方法 当 在 1805 年 或 之 前 不 久 的 基 个 
HBJ. 

勒 这 德 站 该 书 72 一 75 丰 描 述 了 最 小 二 乘法 的 思想 .基体 作法 
及 方法 的 优点 . 他 提 到 :使 误差 平方 和 达到 最 小 ,在 各 方程 的 误差 
之 闻 建 立 了 一 种 平衡 ,从 而 防 比 了 某 一 极端 误差 (对 决定 参数 的 舍 
计 值 ;取得 支 妃 地 位 ,而 这 有 助 于 揭示 系统 的 更 接近 真实 的 状态 . 
的 确 ,考察 勒 让 德 之 前 一 些 党 者 的 做 法 ,都 是 把 立足 点 放 在 解 出 一 
个 线性 方程 组 上 . 这 种 做 法 对 于 误 善 在 各 方程 之 间 的 分 布 的 影响 
如 何 ,是 不 清楚 的 . 

在 方法 的 上 县 体操 作 上 ., 勒 让 德 指 出 ,为 实现 (5) 式 而 对 各 名 求 
偏 导 数 所 形成 的 线性 方程 组 


点 
3 -二 中) 一 (), 有 一 一 ] vs 直 ， 6) 
r= | 


时 
局 ， 
5 一 


只 水 及 简章 的 加 、 乘 运算 ,至 于 解 线性 方程 组 ,这 是 当时 已 知 的 其 
了 对 


他 方法 也 不 分 的 . 现今 我 们 把 56) 叫 做 正则 方程 组 ,这 是 后 来 高 斯 
引进 的 称呼 ， 

关于 最 小 二 乘法 的 优点 , 勒 让 德 指出 了 以 下 上 几 柔 . 一 是 通 疹 的 
算术 平均 值 是 其 一 特例 ,这 我 们 在 前 面 已 指出 了 .第 二 ,如果 观 察 
便 全 部 丘 履 符合 某 一 线性 方程 , 则 这 个 方程 必 是 最 小 二 乘法 的 解 . 
第 三 ,如 果 在 事 语 打算 弃置 某 些 观 察 值 不 用 或 增加 了 新 的 观察 值 ， 
对 正则 上 方程 的 髓 改易 于 完成 . 从 现在 的 观点 看 ,这 方法 内 涉及 解 线 
性 方程 组 是 其 最 重要 的 优点 之 一 (其 他 的 重要 优点 包括 此 法 在 统 
计 推 断 上 的 一 些 优 良性 质 , 以 及 其 广泛 的 适用 性 }. 近年 发 展 起 来 
的 ,从 最 小 二 滋 法 衍生 出 的 其 他 一 些 方 法 ,尽管 在 理论 上 有 其 优 
点 :可 是 由 于 计算 上 的 困难 而 影响 了 其 应 用 . 


$ 4.4” 量 测 子 午 线 长 的 工作 


这 个 内 容 鼎 所 了 勒 泪 德 前 述 著作 的 最 后 几 页 . 由 于 它 在 最 小 
二 乘法 的 发 现 中 所 起 的 作用 ,以 下 较 仔 细 地 作 一 点 介绍 . 

以 如 记 地 球 上 一 点 的 纬度 ,0) 记 于 午 线 上 以 该 点 为 中 点 的 1 
庶 的 蜂 长 .前 已 指出 ,在 假定 地 球 为 一 个 微 袜 的 球体 时 ,可 以 证 明 
近似 地 有 (4) 式 . 迫 此 ,所 要 做 的 工作 是 :根据 在 地面 上 若 平 点 实测 
到 的 8 和 (外 值 ,去 估计 待定 参数 各. 因为 在 实地 量 测 时 ,被 
量 测 的 一 段子 午 线 不 一 定 是 1 上 度 , 交 此 勒 让 德 把 方程 (4) 转 化 为 下 
面 的 形式 ( 注 3)， 


pp dH ) attt,m) 


28 500 下 28 500 


tas —dcostH +H), C7) 


这 里 8 利 yg 外 别 是 镇 量 潮 的 那 段 子午 线 两 端点 的 纬度 (都 在 北 半 
球 , 放 和 .1(0,8 ) 是 这 段子 午 线 之 长 , 按 方 程 (4), 有 
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8 二 站 
D=1(45) =m (8) 
可 以 证 明 { 注 32: 


1 la 总) 


由 于 要 求 的 子午 线 全 长 为 360DD,; 由 (39) 式 可 知 , 对 我 们 最 重要 的 参 
数 是 (7) 式 中 的 .本 来 ;利用 8. 和 六} 的 实测 值 可 计算 


1 一 全 全 他 (y 为 人 村人), 再 利用 (4) 式 可 估计 .4 因而 万 


不 明白 勒 让 德 为 何不 用 (4) 而 要 用 看 来 更 复杂 的 (7?) 式 . 
勒 让 德 当 时 有 5 个 点 的 实测 数据 ,如 下 : 


地 点 纬度 {北纬 绪 长 

Eyunkirk S12 10 + SO" 
pt 

Pantheon 48°50 本 日 75" 
76 145.74 

Fwaux 4B°10 42 5 人 站” 
84 424. 55 

{Carcassonne 43"12 5 站 个 
, 52 749. 48 

Nontiouy 由 1 之 44 * 80 


这 5 个 地 点 多 在 过 巴黎 芍 子 午 线 上 . 除 Montiouy 在 西班牙 已 塞 
罗 那 附近 外 ,其 余 都 在 法 国境 内 . 其 中 Dunkirk( 训 克 尔 克 } 在 英吉 
和 锌 海峡 翌 边 ,为 二 戌 时 的 著名 地 点 . 1940 年 8 月 当 希 特 勒 攻陷 法 
国 时 , 医 国 全 了 的 主力 在 此 成 功 地 渡海 撤 问 本 土 . 

上 表 中 的 弧 兵 是 以 " 模 ?为 单位 :一 模 等 于 12.78 只 . 弧 长 一 栏 
所 表示 的 是 以 上 下 师 地 点 为 端点 的 子午 线 长 ,因而 此 表 给 出 了 4 
对 C8, 和 28, 的 值 . 勒 让 德 注意 到 , 相 邻 两 段 绝 有 一 公共 端 
点 ,故此 点 纬度 的 测量 误差 ,对 这 两 诺 弧 的 8 一 8 都 有 影响 ,因而 
利用 上 表 按 57) 直 所 得 的 4 个 方程 并 非 独立 ., 若 以 ees 记 上 表 
中 5 个 点 (由 北向 南 ) 的 纬度 测量 误差 , 则 由 表 中 的 数据 ,不 难 算 
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出 ， 

FE -Ps=0. DD2 923T2.1920 0. 530,. 

es —es—=0.003 100+2.6720,—0,351a,, 

ee 二 =—0.001 096T2. 962a 0. 0478) 

6 一 ea 一 人 OODL 308 1. 851e — 0. 2830,. 
可 以 很 是 er…e; 独立 同 分 市 ,有 公共 方差 丰 , 则 随机 问 者 
(PI er te es 6 一 ee 一 ei 有 协 方 差 阵 

2 -一 由 让 
v= je (11) 
0 一 1 2 一 1 
| 0 0 一 1 ?| 
出 于 除了 一 个 常数 因 于 外 为 已 短 , 按 现行 的 最 小 二 茨 人 策 计 理 
论 : 我 拉 和 容易 算 央 tase 的 一 个 在 理论 上 看 为 优生 的 知 计 , 侍 此 
竺 计 切 原始 意义 下 的 最 小 二 乘 估 计 有 出 入 . 
对 让 德 处 理 这 个 问题 的 做 法 ,是 形式 上 引进 一 个 新 的 佑 数 e.， 

并 记 之 为 &: 熟 后 形式 地 把 忆 ) 改 造 为 4 个 方程 . 例如 ;把 (10) 的 
最 先 两 个 方程 相 加 .然后 把 e;《 记 为 ae) 移 至 右 过 ,得 

e1 一 0 006 023 十 an 十 4.864al — 0. 9140,. (12) 
C10) 的 党 2, 第 4 个 方程 .只 须 把 es 穆 至 右 进 并 改 记 为 a@, 即 得 到 
形 如 (12) 的 方程 ,左边 为 eet. 又 (10? 的 最 后 两 方程 要 加 得 到 形 
如 (12 了 的 方程 ,左边 为 .再 配 上 ece: 一 o, 即 得 到 5 个 方程 ,可 按 原 
始 的 最 小 二 琴 法 求解 ,结果 得 @ 的 估计 什 为 

ai 一 0.000 077 8. 


按 (9) 式 算出 刀 之 估计 值 为 28 497. 78( 模 ), 工 子午 线 长 估计 为 


30 万 一 2 564 80D 。27 模 )， 
其 于 万分 之 一 : 即 打 算 取 为 了 米 之 长 :为 3.28 路 即 99.907 有 8 厘 
米 , 弛 再 行 定义 有 差距 . 现行 1 米 是 定义 为 存在 巴黎 的 一 根 么 尽 原 
前 之 长 . 
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‘10) 


碎 当 时 数理 统计 学 发 展 的 水 平 看 ,; 勒 让 德 注意 到 因 和 名 方程 ( 指 
(10)}) 误 差 不 独 立 因 而 不 应 直接 使 用 最 小 二 乘法 求解 , 确 是 难 能 可 
扯 . 但 从 理论 上 人 分析, 他 的 处 理 方法 并 不 正确 .es 是 随机 误差 ,以 之 
作为 参数 是 不 行 的 .其 实 这 也 末 能 使 变换 所 得 5 方程 的 误差 独立 . 
不 过 ,尽管 在 理论 上 有 上 述 缺 陷 , 他 的 计算 结果 ,与 按 现 行 正 确 理 
论 计 算 的 结果 比较 .相差 很 痛 根 : (a,a) 的 "最 优 线性 无 偏 司 计 ”， 
记 沟 (Ca 7 由 公式 


1 ry | 


， | = CYR KV (13) 
,| 
给 出 ,其 中 
2.192 一 0.563 一 0. 002923 
2. 672 —0.351 一 0. 003100 
12.962 0.047 | 0.001096 
1.851 0.2863) 0.001808 


而 人 由 (CI1) 给 出 , 蕊 为 天 的 转 去 . 按 (13) 式 .算得 ai= 
0. 000 078 2, 再 出 {9}) 式 算出 品 的 估计 和 值 为 283 497,390D 的 二 万 
他 之 一 为 99.907 9 厘米 ,与 款 证 德 的 结果 很 接近 . 


最 小 二 飞 法 在 19 世纪 初 发 明 后 ,很 快 得 到 欧洲 一些 国家 的 天 
文 和 测 地 学 工作 者 的 广泛 使 用 . 所 不 完全 统计 , 自 1805 年 至 1864 
年 的 60 年 期 间 , 有 关 这 一 方法 的 研究 论文 约 250 篇 ,一 些 百 科 全 
书 , 包 括 1837 年 出 版 的 不 列 颐 百 科 全 书 第 ?7 版 ,都 收 进 了 有 关 这 个 
方法 的 介绍 . 在 研究 论文 中 ,有 一 些 是 关于 最 小 二 乘 估计 的 计算 ,这 
起 太 解 绢 性 方程 组 . 高 斯 也 注意 了 这 个 问题 , 纵 出 了 正则 方程 的 命 
名 并 发 展 了 解 方 程 的 消去 法 , 即 高 斯 消去 法 . 位 是 ,在 电子 计算 机 出 
现 以 前 , 当 参 数 个 数 5 即 (3? 式 中 的 上 如 较 大 时 ,计算 的 企 务 还 是 很 移 
重 . 1858 年 ,英国 为 绘制 本 国 地 图 作 了 一 次 大型 的 survey, 其 数据 
处 理 用 最 小 二 乘法 涉及 模型 53) 中 上 一 920.n 一 LI 554. 用 两 组 人 员 
独 并 计算 , 花 了 两 年 半 的 里 间 才 完成 . 1958 年 我 国 某 研究 所 计算 一 

$3 


个 炼 钢 方 年 的 课题 ,涉及 用 最 小 二 乘法 解 13 个 自 变 量 的 线性 回归 ， 
30 余人 用 电动 计算 机 算 , 夜 以 继 日 花 了 一 个 名 月 的 时 间 . 

和 蔓 让 德 的 工作 没有 小 及 最 小 二 碰 法 的 误差 分 析 问 题 . 这 一 所 
由 高 斯 在 1869 年 发 表 的 正 态 误差 理论 加 雇 补 足 ,详细 介绍 见 第 五 
章 . 了 简 斯 这 个 理论 对 于 最 小 二 乘法 之 用 于 数理 统计 有 极 重 要 的 意 
党. 这 -点 在 20 世 纪 贡 色 特 . 费 欧 尔 等 人 发 展 了 正 态 小 样本 理论 
后 .天 其 看 得 明显 . 正 因为 高 斯 这 一 重大 贡献 .以 及 他 声称 自 1799 
年 以 来 一 直 使 用 这 个 方法 ,所 以 人 们 多 把 这 一 方法 的 发 明 优 先 权 
扫 之 于 高 斯 . 当时 在 这 两 位 大 数学 家 之 间 曾 为 此 发 生 优 先 权 之 争 ， 
其 基 名 度 慌 次 于 牛顿 和 莱 布 尼 兹 之 间 关 于 微 积 分 发 明 的 优先 权 之 
委 . 近 年 来 和 还 有 学 属 根 据 有 关 的 文献 研究 这 个 问题 ,也 作 不 出 判 然 
的 结论 . 这 个 公案 太 概 站 只 能 以 “两 人 同时 独立 作出 ”来 了 绪 . 但 无 
论 如 何 ; 第 一 个 在 书面 上 发 表 的 是 勒 让 德 ,他 有 理由 占 先 一 些 . 

我 们 已 指出 ,最 小 二 蒋 法 是 针对 适合 形 如 (2) 式 的 线性 关系 的 
观测 数据 而 作出 的 ,现在 统计 学 上 把 这 叫做 线性 (统计 ) 模 型 一- 
当然 ,其 含义 比 最 初 所 赋 于 它 的 要 广 得 多 .最 小 二 乘法 在 数理 统计 
尝 中 的 显 蔡 地 位 ,大 部 来 自 它 与 这 个 模型 的 联系 . 另 一 个 原因 是 它 
有 简单 的 线性 表达 式 . 这 不 仅 使 它 易于 计算 ,更 重要 的 是 ,在 正 态 
远志 的 假定 下 ,' 它 有 较 完 善 的 小 样本 理论 ,使 基于 它 的 统计 推断 易 
于 操作 且 有 关 的 概率 计算 不 难 进行 .其 他 的 方法 昌 也 可 能 具有 基 
种 饶 点 ,但 由 于 缺乏 最 小 二 乘法 所 具备 的 上 述 特 性 , 故 仍 不 可 能 取 
代 最 小 一 乘法 的 位 置 , 这 就 是 此 法 得 以 长 盛 不 大 的 原因 ， 


$ 4.5 高 斯 的 贡献 


遇 斯 对 最 小 二 乘法 的 最 大 贡献 ,当然 是 在 建立 正 态 误差 理论 
上 ,这 个 题目 留待 下 章 缁 谈 . 除 此 以 外 ,他 在 这 方面 还 有 一 个 重要 
页 献 , 即 大 家 耳熟能详 的 高 斯 一 马尔 科 夫 定理 . 
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按 通 常 的 记 蕉 把 线性 模型 写 汶 
机 一 二 +e,; i =- 一] > ,天 
这 里 w 和 > 分 别 为 ] 维和 pp 维 ,x; 视 为 普通 的 已 知 p 维 向 量 , 不 带 
随机 性 ,而 为 狼 立 同 分 布 的 随机 误差 ,期 望 为 0 方差 e 非 DO 有 限 . 
用 最 小 二 乘法 ,得 到 决定 中 的 最 小 二 乘 估计 用 的 线性 方程 组 
Sp =XY. 
尽 二 Cr 天 一 yy 斯 称 这 个 方程 组 
为 正则 方程 组 . 他 设计 了 - -种 消 元 法 来 解 这 上 方程 给 , 即 沿用 至 今 的 
高 斯 消去 法 . 从 所 得 的 解 语 一 S$ "XY 易 知 记 是 有 的 (线性 ) 无 仿 
合计 . 又 对 8 的 任 一 线性 活 数 8, 其 最 小 二 乘 舍 计 c8 也 是 ( 线 
性 无 仿 估 计 . 
高 斯 -- 马 尔 科 夫 定理 断言 ,在 cB 的 一 切线 性 无 惫 合计 类 
中 ,惟有 其 最 小 二 乘 佑 计 必 有 的 方差 达到 最 小 . 这 个 定理 被 奉 为 
最 小 二 乘法 理论 中 最 重要 的 理论 结果 , 它 从 统计 学 的 角度 肯定 了 
最 小 二 屏 估 计 的 合法 性 . 在 此 前 ,最 小 二 和 霓 居 计 只 是 一 种 算法 , 尽 
管 它 看 上 去 合理 号 有 计算 简单 的 优点 ,但 还 不 足以 回答 它 在 费 小 
误差 这 个 根本 点 上 ,究竟 有 何 出 众 之 处 . 这 个 定理 对 此 作出 了 回 
签 .下面 我 们 篇 畴 介绍 一 下 这 个 重要 结果 的 隶 起 及 命名 过 程 . 
事实 上 ,最 初 注意 这 个 问题 的 是 拉 普 拉 斯 . 他 考虑 x, 为 1 维 
的 情 阅 .由 
YO ls 
两 边 狗 以 常数 c, 再 对 7? 二 1,-…,n 相 如 ,得 


Sey Yoe 
P= 十 = 十 二 
er， Dor 


对 任何 c,，, 上 式 定义 的 8 是 8 的 无 偏 和 估计 . 为 使 BP 的 或 然 误差 最 小 ， 
当 e 汶 正 态 时 ,内 要 & 的 方差 尽量 小 就 成 ,而 
名 5 


o ce 
Var(é,) = — 
(Den) 
出 施 瓦 薪 不 等 式 有 


| Ds Zr 2 


对 
| 
Ci, 


拉 斯 使 用 其 中 心 极限 定理 (二 一 近似 地 服从 正 态 分 布 ), 仍 能 ( 近 


Cnty 
“一 上 


正 是 最 小 二 蒋 估 计 . 者, 不 一 定 服 从 正 态 分 布 但 很 太 , 则 科普 


似 地 ) 得 出 上 述 结 果 . 
拉 普 拉 斯 上 述 论 证 作 于 1811 年 ,在 得 知 高 斯 导出 误差 正 态 分 


E| Ycel- 
使 EE 二 一 一 一 一 晤 小 用 中 心 极限 定理 ,在 n 很 大 时 ， 
| 2 er, | 


J 这 茬 联 问 于 万 小 -一 飞 准 则 ， 有 意思 的 是 :在 这 样 -- 个 甘于 最 小 二 条 外 的 问题 
中 . 拉 音 拉 斯 淮 有 最 最 小 二 乘 玲 则 ,也许 是 觉得 * 以 素 难 则 证 本 准则 "有 所 不 导 . 如 果 
他 用 最 小 二 冬 准 则 , 则 他 的 想法 与 商 斯 一 致 ( 见 下 ?而 会 得 出 与 商 斯 一 样 的 结果 . 这 件 
捉 说 明 拉 昔 近 斯 对 一 科 淮 风情 有 独 钟 . 人 人 们 也 把 他 作为 这 准则 的 创始 大 . 他 不 是 最 蕴 
使 用 一 汇 准 则 的 人 也 是 这 批 人 中 之 一 ,与 下 文 提 到 的 波斯 科 詹 奇 大 致 同时 ， 


总 丘 


Dee se N(0,0 DD》 ec:). 于 是 近似 地 有 
一】 一 了 


以 下 与 前 述 一 样 . 

拉 普 拉 斯 作 这 类 论证 是 为 了 说 明 ,用 他 的 中 心 极限 定理 也 可 
导出 最 小 二 乘法 .但 高 斯 注意 到 , 若 不 内 或 然 误 善 厦 了 问题 (只 有 在 
正 态 或 至 少 是 对 称 的 场合 ,或 然 误 着 才 有 意义 ) 而 只 要 求知 计 的 方 
差 最 小 , 则 像 e 为 正 访 或 nn 很 大 这 类 限制 都 无 必要 .1823 年 ,他 在 
其 蔷 作 4 数据 结合 原理 (第 一 部 分 '? 中 ,对 任意 维 参 数 8 的 一 个 分 
量 的 情况 证 明了 高 斯 -- 蕊 尔 科 去 定理 . 他 的 证 法 是 分 析 性 的 : 设 


oY 二 jcy; 为 户 的 无 篇 千 计 , 则 因 
信人 一 ee 

必须 有 r 大 一 (了 人 :站 ). 伍 这 个 约束 下 ; 司 方 差 即 积分 
| St | pr de gt, de edt, 


达到 最 小 ,有 为 的 密度 . 现今 我 们 用 矩阵 的 方法 可 以 更 简洁 地 
和 证明 这 一 统 采 .1823 年 ,高 斯 在 上 述 黄 作 的 第 二 部 分 证 明了 -一般 
形 冻 的 高 斯 - -马尔 科 去 定理 ,还 得 出 了 最 小 二 乘 佑 计 方 盖 的 表达 
式 . 

但 是 为 什么 此 定理 又 附 上 上 马尔 科 夫 的 名 字 昵 ? 据 西 尔 在 # 高 斯 
线性 模型 的 历史 发 展 }》 一 文中 说 ,高 斯 的 证 明 发 表 后 ,有 一 些 学 者 
在 自己 关于 最 小 二 乘法 的 著作 中 写 进 了 自己 的 证 明 , 其 中 包括 德 
国 的 赫 泵 梅 特 人 1872) 和 俄国 的 马尔 科 天 ,后 者 的 证 明和 包含 在 他 
1913 年 在 莱比锡 出 版 的 ¢ 概 率 论 》 中 ,证 法 与 赫 尔 梅 特 的 基本 相 
伺 , 但 么 萤 (J. Neyman) 在 1934 年 发 表 的 一 篇 论文 中 ,以 为 这 是 一 
个 凌 结 果 , 蕊 尔 科 去 的 名 字 于 是 被 缀 在 高 斯 之 后 而 成 为 定理 的 尝 
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了 明 者 之 一 -， 

高 斯 的 贡献 还 包括 :他 导出 了 残 差 平 方 和 的 表达 式 , 并 证 明 
了 :或 差 平 方 和 除 以 nn 一 户 , 是 谋 差 方差 的 一 个 无 俩 估计 ， 

19 世纪 和 后 期 在 最 小 二 避 法 的 研究 中 还 有 一 项 很 重要 的 成 果 ， 
妈 证 明了 残 凑 平方 和 服从 分 布 s: 裕 . ,中 ,这 里 习 ,是 自 内 上 度 n 一 pp 
的 分 布 { 假 定 和 矩阵 有 秩 .一 船 情 损 ,自由 度 为 ~- (站 的 
向 )). 其 最 简单 的 特例 ,是 赫 尔 梅 特 在 1875 年 作出 的 ( 注 5). 一 般 
情况 则 出 自 皮 泽 蒂 (5P. Pizzetti) ,在 他 1891 年 出 版 的 一 本 著作 中 . 
和 配 是 用 富 兵 分 析 得 出 这 个 结果 的 , 即 先 计 算 残 差 平 方 和 的 特征 郴 
数 簿 皮 转 得 到 其 密谋. 在 这 一 证 明 中 实 味 击 证 明了 残 差 平方 和 与 
最 小 二 乘 佑 讨 的 独立 性 . 如 今 的 线性 模型 教 本 中 是 用 正 交 变换 法 ， 
很 简单 地 得 出 这 些 结 果 . 

我 们 看 到 ,19 世纪 时 有 关 线 性 模型 和 最 小 二 老 法 的 研究 ,已 
达到 了 很 深入 的 水 平 ,而 当时 高 尔 登 的 相关 回归 刚 起 步 ,Student 
的 上 :分布 还 要 等 凡 二 年 , 简 其 实 当 时 的 水 平 已 能 使 这 个 结 黑 成 为 
一 个 简单 推论 . 症结 在 于 : 终 19 世纪 ," 数 据 结 合 学 者 ”与 统计 学 者 
是 两 批 上 大 , 井 水 本 犯 河水 ,统计 学 家 不 熟悉 上 述 这 些 作家 的 昔 作 ， 
这 很 有 可 能 使 数量 统计 的 车 二 重要 方面 ( 邵 自 Student 发 端的 小 
样本 理论 友 费 葡 尔 的 方差 分 析 } 的 发 麻 灌 后 了 几 十 年 ， 


3 4.6 其 他 方法 


在 收集 大 量 数据 时 ,个 出 或 少量 数据 可 能 会 发 生 重 大 的 错误 ， 
这 错误 不 是 指 随 机 误差 一 一 闭 是 一 般 数 据 中 部 会 有 的 ,是 属于 正 


9 紫色 市 间 淄 有 和 专门 镍 称 ， 此 吉 称 二 记号 大 约 来 自 1900 年 其 尔 -。 
民 泵 泛 太 于 扫 从优 麻 检 验 的 多 章 . 关 为 他 把 检验 统计 第 记 为 多 .而 此 统计 量 舶 极限 分 
布 是 洋 分 布 . 
ep: 


常情 这. 这 里 说 的 错误 是 指 一 些 往往 是 可 以 避免 的 原因 ,比方 说 由 
于 保 记 ,而 产生 的 过 显 著 的 差错 . 例如 一 次 试验 结果 应 该 是 
1, 253, 却 记 成 12. 53. 基 次 试验 中 仪器 没有 调 准 , 或 配方 有 差错 ， 
从 而 导致 坛 验 结果 与 正常 范围 有 显著 偏离 ,等 等 . 

这 种 有 重大 错误 的 数据 在 数理 统计 学 中 叫做 “异常 值 >, 异 党 
值 的 存在 一 般 会 对 统计 分 析 的 精度 和 可 靠 度 产 生 不 良 的 影响 ,但 
影 吗 程 度 如 何 , 与 也 用 的 统计 方法 有 关 . 举 一 个 极端 的 例子 ; 设 在 
某 一 社区 中 抽取 15 户 估 家 以 千 计 该 社区 的 户 均 收入 , 凡 ris***， 
zs 了 所 抽 得 的 15 户 的 收入 .有 两 种 方法 可 用 ;一 是 计算 ri .…' xi; 
的 算术 平均 <, 以 之 作为 全 社区 户 均 收入 的 合计 . 另 一 是 用 zx,… 
xis 的 样本 中 位 数 避 ; 即 把 xz,… ,zis 按 大 小 排序 的 第 3 位, 现 设想 
该 社区 中 有 一 户 年 收入 极 高 , 则 样 汪 中 是 否 包 仿 这 一 户 ,会 对 合计 
值 z 产生 很 大 的 影响 ,而 且 , 当 抽出 的 户 数 只 占 全 社区 户 数 很 小 
一 部分 《这 是 通常 的 情况 ) 时 ,. 若 样本 中 珊 瑟 包含 这 一 户 工 . 则 合计 
会 显 着 她 候 高 ,但 如 用 样本 中 位 数 mx; 则 少量 特 轻 值 的 出 现 一 点 也 
不 影响 其 值 . 

如 二 一 个 统计 方法 受 少 量 异 常 值 的 影响 比较 小 , 则 称 该 方法 
具有 稳健 虱 (robustness). 拿 上 例 来 说 , 的 稳健 祥 好 而 工 较 差 . 
由 于 在 实际 应 用 中 难于 完全 加 免 蜡 常 值 的 出 现 ,稳健 人 性 是 受 应 用 
者 欢迎 和 重视 的 一 种 性 质 . 当然 ,这 也 有 一 定 限 度 , 不 是 说 在 任何 
场合 下 总 是 盖 稳 健 僵 好 ,因为 一 个 良好 的 统计 方法 应 具备 的 性 质 
不 止 一 蜗 . 比如 说 ,稳健 与 效率 往往 是 一 对 诈 盾 ,过 于 强调 稳健 性 
可 能 会 以 御 性 效率 为 代价 . 正如 在 工作 中 , 某 种 情况 下 稳健 性 的 过 
分 考虑 会 流 于 保守 和 僵化 ,从 而 责 失 进取 的 机 会 . 

最 小 二 屁 法 是 一 种 稳健 人 性 较 差 的 方法 ,原因 在 于 其 目标 函数 
是 误差 的 平方 ,是 一 个 增长 很 快 的 函数 , 以 图 4, 1 为 例 , 设 变量 ， 


T 如 坚 样 本 崩 实 是 随机 地 抽 得 的 ,包含 这 一 户 不 能 算是 人 人 为 的 错误 ,但 也 不 能 汶 
变 此 一 组 样本 缺 互 代表 性 的 事实 . 随机 抽样 有 时 抽 到 “ 坏 * 样 本 ,是 题 中 应 有 之 立 . 这 一 
导 有 时 寝 用 来 作为 反对 随机 抽样 的 理由 ， 


如 9 


对 工 的 真实 的 回 妇 直线 为 /. 当 数 据 中 没有 吓 常 值 时 ;数据 点 应 分 
布 在 直线 i 的 近 旁 ,图 4.1 中 的 图 点 所 代表 者 . 对 这 样 的 数据 点 施 
用 最 小 二 履 法 ,估计 出 的 回 妇 直线 将 与 7 相 闫 不 名 .可 是 如 数据 中 
有 一 个 异常 点 怀 , 则 因 要 照 硕 这 个 点 ,估计 出 的 回归 线 了 会 与 上 有 
较 大 的 偏离 . 因而 统计 分 析 的 精度 受到 较 大 的 影响 . 如 果 用 一 种 更 


稳健 的 方法 , 则 情况 将 显著 改 状 . 


| 


以 上 的 分 析 也 己 示 了 获得 里 好 的 稳健 性 的 一 种 途 征 ; 革 用 一 
个 增长 比 平 方 更 慢 的 吨 数 pp 去 代替 平方 . 这 个 想法 最 早 是 由 当 民 
统计 学 家 休 伯 (P.J Huber) 在 1964 年 提出 的 . 在 当年 发 表 的 一 项 
工作 中 ,他 把 这 一 想法 用 于 情 计 一 个 位 置 参数 昌 鬼 情况 , 即 xz; 二 #8 


二 el 和 1. 取 定 耳 数 o, 找 出 使 画 数 M(2) = 》) p(x, 一 站 达到 


最 小 的 日 . 记 六 下 . 9 称 尘 上 的 夺 导 计 ， 

当 pl) 二 ww 时,M 估计 芭 最 小 二 敢 导 计 . 由 于 可 以 有 许多 
可 能 的 选择 ,Mf 什 计 不 是 一 个 单一 的 确定 慎 计 ,而 是 一 类 估计 .一 
明 ,ptii} 汶 sw 鸭 惕 隐 数 (好 站 一 8 一 pa) 目 在 50 处 蝴 的 上 
天 而 上 上升. 上 升 巡 度 盖 人 慢 ,所 得 的 4 估计 稳 妇 性 人 盖 好 . 常用 的 情 沈 
有 Ptae) 一 Ia 它 引出 的 息 计 称 为 最 小 一 乘 佑 计 , 将 在 下 面 作 较 仔 


细 的 过 沦 . 男 一 种 常用 的 4。 是 在 la1 较 小 时 为 平方 而 1a| 较 大 时 为 
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线性 ,或 上 2 较 小 时 为 线性 而 较 大 时 为 常数 等 .到 1973 年 , 休 伯 把 
这 一 想 汶 推广 用 于 一 般 线 性 回归 的 情形 , 称 为 血 归 的 对 估计 .他 
的 这 些 王 作 在 数理 统计 界 有 相当 的 影 啊 . 自 70 年 代 以 来 ,关于 邓 
估计 的 研究 吸引 了 一 批 数 理 统 计 学 家 .要 用 之 于 实际 ,这 种 一 般 的 
xz 信 计 有 其 麻烦 之 寻 . 一 是 使 极 值 达到 的 解 没 有 显 式 表 达旦 很 椒 
容易 计算 ,这 在 自家 高 性 能 计算 机 比较 普及 的 情 沈 ;或许 不 成 为 大 
可 是 ,但 总 不 如 最 小 二 乘 合 计 有 一 个 容易 计算 的 线性 表达 式 ( 对 线 
性 回归 而 言 ) 来 得 方便 . 另 一 个 是 分 布 问题 ,即使 在 模型 为 线性 且 
随机 误差 服从 正 态 分 布 的 情况 ,24 生计 及 基于 这 种 估计 的 统计 量 
的 分 布 也 求 不 出 ,只 能 近 做 地 用 其 大 样本 分 布 代替 ,而 这 一 近似 的 
精 上 度 如 何 充 从 得 知 . 但 对 最 小 二 乘 杆 计 而 言 ;由 于 它 是 观察 秆 的 线 
性 多 数 ,在 误差 服从 正 态 分 布 时 ,有 一 套 精 确 的 小 样本 理论 ,由 于 
这 些 原因 ,迄今 为 止 M 估计 的 使 用 还 比较 腿 ,不 足以 动摇 最 小 
二 科 法 的 优势 地 位 . 

在 MM 估计 类 中 有 一 个 重要 特例 , 即 前 文 提 到 的 最 小 一 乘 佑 
计 . 最 小 一 敢 法 的 访 史 渊源 其 实 比 最 小 二 滋 法 还 早 ,并 不 是 休 位 方 
法 的 附 产 物 . 在 文献 中 ,最 小 一 乘 佑 计 也 常 被 称 为 最 小 绝对 偏差 佑 
计 , 由 于 其 重要 性 值得 知 作 介绍 . 

最 小 一 乘法 是 波斯 科 维 奇 在 1760 年 提出 来 的 . 自 1755 年 起 ， 
他 授 身 于 子午 线 长 的 问题 ,也 是 使 用 近似 的 关系 式 C4). 他 手头 当 
四 有 5 个 节点 人 基 多 好望角. 均 马 . 马 黎 和 拉 善 兰 ) 的 数据 . 不 过 ， 
他 关心 的 主要 不 是 子午 线 长 本 身 , 而 是 通过 它 去 抉 定 地 球 的 桶 率 


(定义 为 [ 弘 '9 和 后 的 意义 如 方程 (4)). 一 开始 ,他 使 用 以 下 的 


做 法 :在 上 述 5 地 点 的 数据 中 任 取 2 个 ,可 以 构成 未 知 数 0 和 6， 
的 两 个 线性 方程 ,而 求 得 其 解 . 他 原意 是 取 这 10 组 解 的 算术 平均 ， 
其 值 他 看 上 去 不 大 满意 ,于 是 他 舍弃 这 10 个 组 中 认为 不 大 合理 的 
一 二 个 组 ,结果 仍 不 甚 满意 ,因此 最 后 他 放弃 了 这 种 一 对 一 对 分 别 
处 理 的 做 法 ,而 提出 了 一 种 综合 全 体 数 据 的 方法 . 该 法 基本 上 就 是 
9] 


现在 流行 的 最 小 一 乘法 ;但 波斯 科 维 奇 附 吉 了 一 个 约束 条 件 , 邮 全 
部 误差 的 代数 和 为 0. 以 本 问题 为 例 , 他 的 提 法 有 以 下 形式 : 


> ig) — 8 — Osin:g) = 0, (14) 
> | 人 (一 站 一 如 sins 虽 ) 最 小 . (15) 


这 里 加 ,…* ;9 是 测量 的 5 个 地 点 的 纬度 . 但 是 ,波斯 科 维 奇 未 能 给 
出 这 个 约束 极 倡 问题 以 一 个 代数 解 活 ,而 是 别 上 出 必 裁 地 给 出 了 一 
个 借助 于 拖 何 的 解法 ,此 处 不 细 述 . 直到 1783 年 , 拉 普 拉 斯 注意 到 
这 个 问题 ,他 发 现 了 一 种 简易 的 代数 解法 , 写 在 他 于 1799 一 1]805 
年 加 出 艇 的 《天 体力 学 的 第 2 卷 中 . 其 方法 的 实质 部 分 如 下 :把 
(C14) 、t15) 分 别 简写 为 (用 一 般 的 x 取代 50， 


Ny CO— 0 br) = 0, (16) 
一 

” 

> 一 下 一 8r| 最 小 . (17) 
1 一 外 

加 ba 加 Dy 
记 了 一 一 ,3 一 一 一 - 由 (i163 式 得 
一 各 — Hr=0, 


解 出 二 yy 一 所 .以 此 乱 人 (17) 式 ,成 为 


> i 一 BT | 最 小 sr 二 一 一 yi 一 Jy. (18) 
这 样 就 把 方程 中 的 常数 项 消去 了 由 此 出 发 , 拉 普 近 斯 证 明了 ， 


使 > 六 一 2 达到 最 小 的 负 决定 的 过 程 如 下 ( 注 4) ,不 妨 设 
所 有 的 zj 天 0. 计算 守 ,二 1,… ,ns, 把 它们 由 小 到 大 排列 ,不 妨 设 


意志 


记 4 二 2 lx/1. 找 自然 数 让 使 
[| zi 十 十 zi) 了 
a < 9 


Ee 》、 1 工 
A 19) 


则 可 分 则 丙种 情况 :一 是 119? 第 2 式 成 立 不 等 号 .这 时 所 的 惟一 
解 是 2. 二 是 (19) 第 2 式 成 立 等 号 .这 时 亲 区 阿 [六 :, 关 汪 J 上 但 
一 个 数 都 是 的 艇 . 解 山 贞 后 ,由 = yr 解 出 让. 

由 此 例 看 出 ,最 小 一 乘 值 计 可 以 木 惟一 .事实 上 ,这 种 不 惟一 
性 在 最 简单 的 例子 一 一 估计 位 署 参 数 中 也 可 以 出 再 ,因为 使 
SA、 | > 0| 达到 最 小 的 好汉 LE 为 俩 数 时 ,可 以 是 [zraj 41 


二 时 任何 一 个 数 ,这 串 Yes 是 A sh 控 由 小 到 大 的 排 
3 统计 学 上 称 -了 ;i A 的 次 序 统 计量 )， 这 种 不 唯 
一 性 ,根源 于 函数 eta) 一 zi 不 是 严格 西 本 数 ,这 里 不 细 说 了 . 

以 上 的 解法 得 力 于 由 约束 条 件 可 以 消去 其 一 个 参数 . 若是 在 
3 和 二 站 十 下 十 Xs 的 情况 而 不 全 2 如 使 有 “误差 和 为 0" 的 纲 
东 存 在 ,也 无 能 为 力 了 .甚至 在 y= 所 十 8x 的 情况 ,如 无 约束 条 件 ， 
求解 也 不 易 . 现今 所 理解 的 最 小 一 冬 法 都 是 不 带 约 束 的 . 

上 述 发 展 出 现在 1805 年 最 小 二 蔷 法 渤 生 之 前 . 可 是 ,册子 当 
时 无 法 解 左 计算 问题 ,最 小 一 乘法 在 此 后 的 百 余 年 未 受到 应 用 界 
的 重 饮 ,直到 1950 年 代 发 现 了 用 线性 规划 求解 的 方法 及 电子 计算 
机 时 出 现 , 计 算 的 困难 不 复 存在 . 大 样本 理论 的 成 果 给 了 一 个 在 样 
本 足够 多 时 可 行 的 统计 推断 方法 ,特别 是 在 革 些 应 用 部 门 中 ,如 数 
量 经 济 学 中 ,显示 了 这 个 方法 的 优良 性 质 ,最 小 -- 乘 法 逐渐 得 到 应 
用 穿 的 重视 . 有 人 人 作 过 这 样 的 试验 ; 拿 大 量 的 一 y 散 点 图 ,让 一 
华人 各 自用 目测 的 方法 配 直 线 . 结果 表明 ,大 多 数 人 目测 的 结果 更 
接近 于 最 小 一 磁 而 不 是 最 小 二 乘 所 得 的 直线 ， 
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上 上 面 所 讲 的 M 柯 计 是 根本 度 除 最 小 二 乘 原 则 了 月 男 立 原则 求 
解 . 属于 这 种 性 质 的 估计 还 有 一 些 , 大 都 很 复 于 ,应 用 上 没有 推 开 . 
男 -类 方法 是 对 最 小 二 乘 佑 计 本 身 作 修改 .这 和 直接 与 计算 有 关 ,但 
实 奈 上 与 稳健 性 的 考虑 也 有 相通 之 处 .一 个 代表 性 的 例子 是 所 请 
“ 瞪 情 计 民 Ridage estimation) 是 1970 年 两 位 美国 统计 学 家 提出 
来 的 .另外 还 有 所 谓 主 成 分 估计 法 ;其 对 最 小 二 乘 信 计 的 修改 方式 
己 岭 估计 不 同 . 这 些 信 计 方 法 如 今 在 应 用 上 使 用 很 多 ,它们 都 有 在 
计算 上 比较 易 行 的 特点 . 


注 1:(4) 式 的 证 明 . 

图 4,2 所 示 是 地 球 与 经 过 
两 极点 的 平面 的 截面 第 一 和 象限， 
地 球形 状 微 烦 , 故 图 中 5 二 1 而 #5 
==], 模 驾 方程 为 


十 之 一 1. (Al) 


地 面 上 一 点 妇 的 纬度 ,并 
非 线 段 OA 与 横 轴 的 夹 阴 go 而 
是 这 梓 确 定 的 :过 4 点 作 一 射 
线 指 向 天 顶 ,4 至 与 过 由 的 切线 
(全 中 之 虚线 ) 亚 下 .4 与 园 轴 的 夹 角 8 定义 沟 4 点 的 纬度 . 由 这 


个 定 广 用 地 球 的 檐 性 不 难 悟 出 ,在 高 纬度 处 子午 线 上 1 度 的 弧 长 ， 
赋 比 低 纬 卉 处 来 得 大 一 些 . 


按 方程 (Al 计算 y 一 拼 . 有 


铬 | 4. 2 


Y=tan(ti80 一 划一 一 tano 一 一 tanfgb05 -一 的 一 一 cot 如 


(A2) 
因此 

' 0 
y 党 


对 得 


Dir 页: rr 


tan “FC=cot#=—— 


由 此 推出 
T= (1 hitanip)-3, 


因而 


dz ltan dy 3 etang 
d5 cos 入 CAS) 


由 (A2) .CAA3) ,得 缔 度 六 ,0(0 和 和 之 人 之 90 中) 之 间 了 子午线 之 长 
沟 


， 1 dx jg 
ar ) do 


-| 《1 十 fan 上] 于 tan:@)3 pitan:g 


ng C1 二 tan:BYydes 


1 prtan dy 


2 
-| ,| 了 十 tan 2 


[i 1 + pitanip 

一 | a — (1 — bysin:g) -zd6. (A4) 

控 (A4) ,注意 到 在 北极 点 处 有 sing 一 1, 知 在 此 点 处 子午 线 1 度 长 

为 二 :其 中 < 一 j80， 即 荆 度 的 弧 庆 值 . 又 在 赤道 处 sing 一 0: 知 在 此 
氮 处 子 千 线 1 度 长 为 zc. 按 方程 (4) ,此 二 者 之 差 记 为 


= eed !— by. (ASY 


Wf = (AG) 
因 为 1];: 有 ij 一 产 写 0, 咸 


二 


C1— C1— bysin’d) fl 地 (1 一生)sins8 


这 于 代替 (AA4) 的 被 积 晒 数 , 并 注意 到 CA4) 中 的 8 应 按 天 度 计 , 得 
第 度 8 外 和 子午线 上 1 麻 之 弧 长 5 的 近代 地 等 于 


yo 


AO acb 1 Cb)sin’g). CAT) 
归 一 方面 了 ,有 


Bp sin =ed ted (1 一 人 Jsin (A8) 
入 让 
Fb 6) (Ag) 


事实 上 , 因 8 二 1, 知 (六 9) 左 边 为 
FTO) 6) 31—6), 
而 右边 为 
5 (SEEyxsl-50 一 区 (十 1 十 1 
一 中 一 六 1 
这 证 明了 CA9) ,由 (7 ao 立即 得 到 (4) 式 ， 


注 2: 证 了 出 

子午 线 长 二 360i(45°)， (CATO) 
事实 上 ,由 (4) 式 有 

1(0)—0, + 0sin’0— a sar 


一 《AH 十 抒 ) 一 全 cos20 一 1(45") 一 sin20. 
因此 知 由 赤道 至 极点 冶 子 午 线 长 , 即 子 午 线 全 长 的 二 ,为 


局 守 
100°) ++i(90° 
C2 CO ;+ (90°)] | Sco, 
1 一 
—907(45°) — 0, os0 +eos180) os ) 
gp, 《cos2 十 cos4 十 十 c9s178”) 
2 = 


由 cos (180°— a}) 一 一 cosa, 知 上 式 等 于 907 45”), 于 是 还 明了 
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A190). 


注 3:f7) 式 的 证 明 . 
设 0 00 DPD=i(45)0 2 


7 中 
— Te ? , 按 (4) 式 有 


2 PI Tsing. 


好 


因 sin'g 二 方 一 (过 Ycos(9 十 9'), 由 上 式 有 
a [ :a 
OO I 45) Seos(d+0 :=D Feos (二 ). 


(All) 


zz ™ 0 
相对 于 ,8, 很 小 (及 这 0) , 故 记 a 一 5 太 y. 岂 上 式 有 


， 1(0,.0) 
A 


< 29,0)| 1 十 部 aacos(8 十 g ) | 


= 7) L108) TD U0,0) Tacost0+P). (A12) 


0, . ， 
因 忆 二 0, 由 (A11) 有 9.0) (9 一 OD, 以 此 代入 (A12) 右 边 的 
第 2 项 ,有 


8 gD- (00,0 ) 十 六 ask8 cos(d4 8). 
因 #8 二 8 ,有 


CAl3) 


PO sin(O ~0), 


因而 
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三 【机 一 下 Jeos (H+ 8 1 一 sin CH — ecosth a). 


(Al4) 
8500 1 _ 
令 qn 一 定 二 7: 有 DD "一 -8560 ;此 有 妈 (9} 臣 -又 
LH) G8) ED ) 
DD 28300 28500 i (A15) 


结合 ( 态 13) 一 (和 15), 盎 得 (72? 式 ， 


注 4: (18) 的 解 . 
这 要 用 到 概率 论 中 的 一 个 初等 事实 ; 设 为 一 个 随机 变量 ， 
玉 IY i 之 oo, 定义 区 数 (x) 二 EX 一 ww| ,以 和 站 记 闫 的 中 位 数 的 集 ， 
则 前 数 了 的 极 小 值 点 的 集 就 是 集 4， 
部 引进 随机 变量 和 ,其 分 布 为 


引 


Dy 0 l=MD MEX 
r= 1 上 一 1 A 


ft 


注意 到 2 志 …<25 ,引用 上 述 定理 , 即 得 所 要 的 结果 ， 


注 5: 赫 尔 梅 特 在 1875 年 考虑 到 特例 是 样本 方 盖 末 一 
SZ) 


+ 二 1 


7 ,其 中 ap 为 从 正 态 分布 Ar 中 搬出 的 独立 


样本 . 他 用 积分 变换 的 方法 导出 了 s: 的 密度 函数 . 据 此 ,卡尔 、 点 
尔 避 主张 ,在 19 世纪 后 期 众多 的 从 各 种 途径 接触 到 这 -一 分 布 ( 有 


的 只 是 2.3 维 ? 的 学 者 中 ,应 推 荐 尔 梅 特 为 此 分 布 的 发 现 痢 . 伤 并 
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在 1931 年 的 (生物 计量 》 林 志 上 介绍 了 赫 尔 梅 特 的 证 明 , 其 楼 概 如 
下 ;Cr 到 CT 十 dz 十 dr 之 则 的 概率 元 为 

Ca exp| — BE dr dr,, 
此 处 < 为 常数 ,以 下 cc 每 次 出 现时 取 值 可 不 同 . 作 变 撞 

El 二 
国之 间 的 概率 元 为 


ce "exp| 一 pas “二 ) 1d6 "站 三， 
和 注意 到 和 只 与 局 .6 有关 .此 办 
一 站 二 一 《十 怀 :二 记 _1)， 


战 由 上 起 对 5, 积分 ;可 得 全 | 一 … £1) 的 概率 元 为 
co exp(— 75s ) dé dE, 
作 变 搞 


十 (人 十- 人， 4 一 


tA 名 | as (Al16} 


简单 计算 证 明 必 ， > :一 ps2 于 是 得 到 (4 ,… ,1,) 的 概率 元 为 c，… 


i 有 _ 
| 一 | 中 一 | ,lL 
exp | i ja 令 展 一 | 5 7 .半径 为 尺 的 n 一 1 维 
FT := | 


球 ,体积 为 <，& ,因此 民 的 概率 元 为 <*exp| 5 得 | RsdR. 因 


$= 到 ,得 ， * 的 概率 元 为 cc * exp| 3 |s ”dy 常数 c 由 


1， 构造 出 秆 换 416) 基 证 明 此 趟 ,是 本 证 明 中 的 麻烦 部 俘 . 苦 用 正 交 恋 换 册 都 可 
中 欠 名 ， 


9 


ss" ds = 1 


| exp| 一 #9 
站 浊 一 -一 一 一 一 
a 2 


一 下 于 四 


一 【时 一 当 ] 
全 


ff 一] 

决定 ,结果 为 一 一 一 
F| 2 

| 


这 个 证 明 复 杂 之 处 在 于 没有 用 正 交 变 换 , 若 用 变换 一 


n= 


率 元 为 (V270) "exp| 一 这 5 2 |d&…d&,, 因 而 (名,… ,部 1) 的 


VA IE 一 2ucvzi2<sr<m 使 成 一 正 交 变换 , 则 (# ，…,6.) 的 概 


袜 率 元 为 (w2Z3 和 “exp | 6 d= 


1 一 1 
一 i 


2.u8*, 于 是 立即 过 渡 到 上 述 赫 尔 梅 特 证 明 的 末尾 部 分 、 
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第 五 章 ” 误 卷 导 正 态 分 布 


悄 春 向 统计 学 家 提出 这 样 一 个 问题 :你 认为 在 数理 统计 学 中 ， 
只 一 个 概率 分 布 是 最 重要 的 ? 则 辕 答 一 定 会 相当 一 致 : 正 态 分 布 . 
这 不 论 从 其 在 实用 上 作为 一 个 描述 数据 的 统计 模型 来 说 ,还 是 从 
其 在 理论 上 所 起 的 作用 ( 雇 中 心 极限 定理 为 代表 ) 来 说 ,都 是 如 此 . 
学 者 们 在 回 题 19 世纪 的 统计 学 时 ,都 或 多 或 少 认为 是 由 正 态 分 布 
所 主导 . 竟 有 那么 多 来 源 和 竹 质 都 不 同 的 数据 符合 这 个 分 布 ,这 一 
点 引起 了 许多 学 者 的 兴趣 以 至 好 奇 ,认为 是 从 纷乱 中 看 到 了 秩序 . 
因此 ,理所当然 ,数理 统计 学 史上 的 许多 重大 的 事件 ,莫不 与 
这 个 分 布 发 生 程度 不 同 的 关联 .我们 不 打算 把 有 关内 容 全 集中 在 
本 章 岂 介绍 :因为 有 的 内 容 结 合 其 他 主题 来 叙述 更 为 合适 . 这 里 我 
们 拒 自 光 集 中 在 测量 误差 分 布 理 论 的 发 展 这 一 条 线 上 .因为 , 虽 则 
犹 英 弗 早 在 1730 年 一 1733 年 间 已 从 二 项 分 布 逼 近 的 途径 得 到 了 
正 厦 密度 函数 的 形式 ,但 当时 其 身分 还 只 是 一 个 数学 表达 式 而 非 
概率 分 布 . 甚至 到 1780 年 拉 普 拉 斯 得 到 一 般 中 心 极限 定理 的 形式 
时 ,也 了 还 是 这 个 情况 .惟有 高 斯 在 1809 年 提出 “ 正 态 误差 "的 理论 
后 . 它 才 取得 “概率 分 布 " 的 身分 并 因此 而 引起 人 人们 的 重视 ,并 随 着 
购 特 茶 特 ,高 尔 登 等 人 在 社会 .经 济 和 遗传 学 等 领域 的 工作 ,将 其 
应 用 由 测量 误差 拓 民 到 广大 的 领域 . 所 以 , 某 本 和 守 源 , 正 态 分 布 这 
条 大 河 的 “ 正 源 ", 还 概算 是 测量 误差 理论 . 这 个 内 容 也 给 上 一 章 的 
主题 作 了 一 个 重要 的 补充 :上 一 章 的 最 小 二 乘法 ,是 作为 一 个 处 理 
注重 数据 的 代数 方法 来 讨论 的 ,看 上 去 与 统计 学 无 美 . 共有 在 建立 
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了 测量 误差 分 布 的 概率 理论 后 ,这 个 方法 才 可 以 视 为 一 个 统计 方 
法 ,并 因此 而 发 挥 其 重大 的 作用 . 

有 * 正 访 ” 就 有 “ 偏 态 ”. 正 态 分 布 无 论 其 闻 盖 面 多 广 ,也 不 可 能 
一 无 例外 . 到 19 世纪 后 期 ,实际 问题 中 数据 与 正 态 分 布 符合 不 好 
的 情况 ,逐渐 为 学 者 们 所 发 现 和 注意 . 这 促使 人 们 去 研究 如 何 梅 作 
出 一些 包 罗 较 广 的 分 布 类 ,以 便 用 于 描述 这 类 偏 态 数据 . 这 方面 的 
二 作 , 以 卡尔 ， 皮尔 撑 在 19 世纪 末 提 出 的 “皮尔 逊 分 布 族 ? 为 代 
表 . 有 关 情 况 也 将 在 本 章 中 略 加 介绍 

本 章 中 我 们 也 要 稍稍 点 到 一 下 有 关 和 多 维 ( 或 多 元 ) 正 态 分 布 产 
生 的 历史 情况 . 如 果 说 ,在 一 维 情况 下 , 除 正 态 分 布 外 ,还 有 少数 几 
个 分 布 在 一 些 特 定 问题 中 起 着 重要 的 作用 ,那么 在 多 维 情况 下 , 除 
多 元 正 态 分 布 外 ,这 样 的 分 布 就 更 见 其 少 . 与 一 维 的 情况 相似 ,多 
元 正 态 分 布 引进 到 统计 学 也 有 两 个 阶段 :起 先是 作为 测量 误差 的 
分 布 , 其 后 才 是 作为 其 他 数据 的 模型 . 

现今 的 读者 可 能 会 觉得 有 点 不 好 理解 : 照 我 们 现在 的 看 法 , 量 
测 误差 也 好 ,其 他 无 论 从 什么 她 方 来 的 数据 也 好 ,其 本 质 都 是 带 有 
随机 误差 ,在 概率 上 服从 一 定 的 分 布 (统计 模型 ) ,统计 处 理 上 都 是 
一 视 同仁 ,并 无 二 致 .为何 当时 (19 挝 纪 }) 的 人 人 把 这 个 区 别 看 得 如 
此 之 重 ? 为 明白 这 个 问题 , 先 要 搞 清 楚 当 时 人 所 着 眼 的 这 个 差别 究 
更 蚌 指 什么 ,这 可 以 用 1885 年 (注意 这 个 时 间 ,已 近 19 世纪 末 ) 埃 
其 涛 斯 4 观测 数据 与 统计 数据 } 一 文中 所 表达 的 观点 来 回答 :对 同 
一 个 对 象 作 重 复 测 量 ,所 得 数据 为 观测 数据 ,对 同一 类 的 一 些 个 体 
中 每 一 个 的 指标 所 作 测量 (如 一 群 人 中 每 一 个 的 身高 测量 ) 的 数据 
为 统计 数据 . 这 种 差别 有 何 重要 意义 昵 ? 按 埃 其 深 斯 上 述 论 文中 的 
涪 法 : “观测 数据 与 统计 数据 共同 之 处 在 于 它们 都 是 群集 在 一 个 平 
均值 的 周围 . 不同 之 处 在 于 ,就 观测 数据 而 言 ,这 平均 值 是 实在 的 
(例如 .那个 (其 身高 ) 被 重复 测量 的 人 的 真正 身高 一 一 引 者 注 ); 而 
对 统计 数据 来 说 ,这 平均 值 蚌 虚幻 的 .* 由 于 这 个 差别 ,在 19 世纪 
时 ,误差 论 和 统计 学 就 被 看 成 是 两 个 不 相干 的 领域 :前 者 被 认为 要 
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用 高 等 数学 处 理 , 而 后 者 则 处 理 观 察 到 的 相对 频率 的 数据 ,. 返 至 
20 世纪 60 年 代 , 统 计 学 家 西 尔 在 一 篇 有 关 线 性 模型 历史 的 文章 
中 还 提 到 ;上述 现 点 在 他 号 文章 的 当时 人 情 有 市 场 . 

上 述 情 况 反 里 了 一 种 现实 ;当时 的 数理 统计 党 还 处 在 一 个 相 
当 幼 稚 的 时 和 代 , 坪 乏 一 个 严 旭 完备 的 数学 框架 . 例如 ,用 现行 的 统 
计 学 ,我 们 很 和 容易 拒 二 者 统一 起 来 :如 一 群 人 身高 的 测量 秆 为 zi， 
我 们 把 这 群 人 想像 成 从 由 无 穷 安 人 组 成 的 总 体 中 抽出 的 样 
本 . 相应 地 ,这 无 窃 总 体 中 个 体 的 茶 项 指标 ,如 此 外 的 身高 ,可 粹 赋 
于 一 定 的 (总 体 ) 分 布 , 例 如 正 态 分 布 Nta,o). 这 样 一 来 ,上 述 测 
量 结 果 zi…z 无非 就 是 群集 在 “实在 的 ” 值 a 的 周围 的 一 些 “ 观 
测 值 ,与 从 对 一 个 大 (身高 真正 值 为 =, 测量 误 差 方 差 呈 ) 密 次 重 
复 测 得 的 值 性 质 上 无 异 .担当 时 妍 没有 无 限 总 体 的 概念 ,因而 也 就 
无 所 明确 佑 计 的 对 象 是 什么 . 

现今 统计 界 一 般 认 为 ,数理 统计 学 作为 一 门 严 整 的 学 科 的 面 
铬 出 现 , 始 于 20 世纪 基 个 时 候 . 这 不 能 说 是 忽视 了 这 以 前 的 大 量 
成 就 ,而 是 有 其 间 理 在 一 一 从 我 们 上 面 讲 的 这 段 历史 针 少 可 以 侨 


悟 一 些 . 


现在 我 们 回 到 本 半 的 一 个 主题 一 一 测量 误差 分 布 理 论 的 历 
各 ,主要 的 贡献 归功 于 高 斯 ,但 问题 可 远 潮 到 16 世纪 伟大 的 天 文 
学 家 全 利 略 . 


$ 5.1 早期 天 文学 家 的 工作 


和 丹 壶 统计 史学 家 哈 尔 德 在 其 著作 《1750 年 以 前 概率 统计 及 其 
应 用 史 》 中 ,指出 天 文学 在 数理 统计 学 发 展 中 所 起 的 作 有 : 
天 文学 目 而 我 至 18 世纪 是 应 用 数学 中 最 发 达 的 领域 ,观测 
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和 数学 天 文学 ; 纵 出 了 建 模 太 数据 氢 合 的 最 初 例子 .在 这 个 意义 
下 ,天 文学 家 是 最 初 一 代 的 数理 统计 学 家 …… 天 文学 的 问题 逐渐 
引导 到 算术 平均 ,以 及 参数 模型 中 的 种 种 估计 方法 ,以 最 小 二 乘法 
为 项 峰 .” 

这 一 段 引 语 也 肯定 了 最 小 二 乘 浅 的 显赫 地 位 . 不 过 ,如 我 们 以 
及 所 歇 指 出 的 ,这 种 地 位 的 确立 ,在 极 大 的 程度 上 避 决 子 一 个 有 效 
的 测量 计 差 理论 的 建立 . 缺少 这 样 一 个 理论 ,最 小 二 乘法 就 不 过 是 
一 个 算 落 ,没有 了 与 统计 分 析 相 联系 的 纽带 ， 

误 臣 理论 的 基本 问题 ,当然 是 指 : 随 机 测量 误差 服从 怎样 的 概 
率 规 律 , 即 有 怎样 的 概率 分 布 . 这 个 问题 的 提出 和 讨论 ,也 是 天 文 
学 虱 的 功劳 . 在 上 述 引文 中 哈 尔 德 提 到 “天 文学 的 问题 乏 浙 引导 到 
算术 平均 ”, 似 应 作 这 样 的 理解 :天 文学 家 最 早 关 心 使 用 算术 平均 
时 合理 性 阿 题 ,并 从 误差 分 布 理 论 的 角度 来 考察 这 个 问题 . 

16 世纪 者 名 的 丹 珍 天 文学 家 第 和 谷 (Tycho Brahe) 在 改善 观察 
仪 问 和 观察 条 件 . 训 练 观察 人 员 方 面 , 做 了 大 量 的 工作 . 他 让 其 助 
手 独立 地 对 某 一 天 文 量 进行 重复 观测 以 资 比 较 , 由 此 对 观测 误差 
的 量 级 获得 了 解 .在 长 达 25 年 的 时 间 内 ,他 对 一 些 天 体 进行 了 系 
统 的 观测 ,上 所 得 数据 成 为 开 普 勒 (Johannes Kepler,1571—1630) 
日 后 建立 行星 运动 定律 的 基 珊 ,而 这 又 对 牛顿 建立 其 万 有 弛 | 力 的 
学 锣 起 了 要 大 的 作用 . 不 过 ,第 谷 和 开 普 勤 都 还 设 有 提 及 建立 随机 
观测 误差 的 概率 理论 的 问题 .但 开 普 勒 在 1619 年 发 表 的 著作 《和 
谐 的 世界 #4 中 提出 了 一 些 建 模 (model building}) 的 原则 ,其 中 有 一 - 
条 是 “模型 选择 的 最 终 标准 是 其 与 观察 数据 的 符合 程度 ”. 从 今日 
的 更 点 看 ,这 ”符合 程度 ?的 提 法 ,只 能 从 统计 分 析 的 着 度 去 理解 ， 
四 而 实质 上 和 草 合 了 误 善 概率 理论 的 问题 . 

伟 六 的 天 文学 家 懈 利 略 (G. Galileo ,1564 一 1642) 可 能 是 第 一 
个 在 其 蔷 必 中 担 出 随机 误 盖 这 个 裤 念 ,并 对 之 有 所 讨论 的 学 性 . 他 
在 1632 年 出 版 的 著作 《关于 两 个 主要 世界 系统 的 对 话 一 一 托 雷 密 


和 荔 怕 尼 }? 中 提 及 这 个 问题 . 他 是 用 “观测 误 盖 ”这 个 名 芍 . 他 没有 
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提出 “随机 ”和 ”人 分布? 这 样 的 概念 ,但 他 所 描述 的 “观测 误差? 的 性 
质 , 表 明 他 的 旨 归 ,实际 上 即 我 们 现 硅 亩 理解 的 随机 误 善 分 布 . 他 
提出 了 以 于 几 点 : 

1. 所 有 观测 值 都 可 以 有 误差 ,其 来 源 可 归 因 于 观测 者 , 伐 器 工 
具 以 受 观 测 条 件 . 

2. 观测 误差 对 称 她 分布 在 0 的 两 侧 -- 一 ~- 按 ; 这 当然 假定 已 排 
除 系 统 误差 的 情况 ,并 明确 表明 他 指 的 是 随机 误差 . 

3. 小 误差 出 现 得 比 天 澳 差 重 频 繁 . 

深 合 这 几 条 ,伽利略 甩 设 想 的 误差 分 布 ,用 现今 的 术语 说 ,是 
一 个 关于 0 的 对 称 分 布 ,其 概率 密度 /tzr}) 随 |z! 增 加 而 递减 . 这 个 
了 原则 性 的 提 法 , 盛 为 日 后 学 者 们 在 研究 这 一 问题 时 的 出 发 点 . 匣 科 
上 略 偿 担 到 妊 差 的 传递 性 质 ,指出 :所 算出 的 5 天体 间 的 ) 上 距离 是 一 些 
观察 但 的 晤 数 . 对 观察 值 的 小 的 变动 :可 以 引起 距离 值 的 太 变 动 . 

当然 :以 上 这 些 先驱 者 的 努力 ,都 没有 超出 定性 式 讨 论 的 范 
图 . 当时 概率 论 发 展 的 水 平 ,也 没有 能 提供 为 进行 有 意义 的 定量 式 
研究 所 必须 的 工具 . 认真 的 努力 始 了 于 18 世纪 的 中 期 . 


$ 5.2 辛普森 的 工作 


伴 普 森 ( 人 《Thomas Simpson 1710 一 1761}》 是 一 个 自学 数学 成 站 
的 人 ,村 犹 莫 旨 的 著作 作 过 认真 的 研读 . 青年 时 曾 沉迷 于 星相 学 ， 
这 和 使 他 对 天 文学 和 数学 感 兴趣 . 他 早年 出 版 过 几 种 有 关机 过 和 精 
算 有 的 书 ,其 关于 误差 理论 的 工作 则 是 在 1755 年 , 那 时 他 是 英国 和 皇 
家 和 军事 学 院 教授 并 被 选 汐 皇家 学 会 会 员 . 

地 的 工作 是 以 一 封 写 第 - -位 点 历 的 题 为 # 在 应 用 天 文学 中 到 
侣 干 个 观察 值 的 平均 的 好 处 ?的 信件 中 提出 的 . 他 在 信 中 指出 ;在 
天 文学 界 , 取 算术 平均 的 合法 并 没有 为 密 数 人 所 接受 . 他 们 认为 ， 
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当 有 名 个 观测 值 时 ,应 选择 其 中 那个 “谨慎 地 观测 "所 得 的 值 , 认 为 
这 上 比 平均 值 可 靠 .辛普森 认为 这 是 一 件 重要 的 事情 ,他 表示 打算 使 
用 数学 方法 去 试 试 ,看 能 否 对 这 个 问题 有 所 进展 ,以 便 使 取 平 均 这 
个 微 法 有 更 大 的 可 信 闲 . 

回 过 头 来 看 ,人 们 会 觉得 : 辛 普 林 所 指出 的 当时 天 文学 家 对 取 
平均 抱 怀 县 的 态度 ,也 有 其 现实 的 原因 . 因为 不 同 天 文 台 的 设备 和 
观测 条 件 . 人 员 素质 上 难免 有 差异 , 故 其 观测 结果 的 可 靠 性 也 有 差 
异 . 取 平均 将 会 使 结果 受到 “ 坏 ” 的 观测 值 的 干扰 ,而 不 如 其 中 的 优 
秀 者 . 这 种 考 赔 悉 在 今日 也 还 存在 . 不 过 也 要 看 到 ;这 种 “择优 ”并 
非 总 是 可 能 . 面 对 众 多 的 观测 值 ,往往 并 无 足够 的 根据 去 鉴定 其 优 
沙 如 和 何 ,只 好 一 视 同 仁 地 对 待 . 用 现在 的 术语 ,只 好 假定 手头 这 些 
观测 值 是 独立 同 分 布 的 . 

辛普森 所 做 的 工作 ,实际 上 并 未 触及 建立 一 般 的 误差 概率 理 
论 的 问题 . 他 只 是 在 误差 {假定 为 独立 同 分 布 ) 满 足 某 种 特定 的 分 
布 的 前 提 下 ,去 计算 平均 误差 (误差 的 算术 平均 , 即 各 观测 值 的 算 
术 平 均 的 误差 ?的 分 布 ,从 而 证 明 在 某 种 概率 的 意义 上 ,平均 误 益 
小 于 个 别 误差 . 现今 无 法 确 务 辛普森 是 否 受 到 前 述 佑 利 虞 等 八 工 
作 的 影响 ,但 有 一 点 与 之 相合 :他 搬 开 未 知 的 真 值 不 论 而 把 注 毅力 
训 在 其 误差 上 . 美国 统计 史家 斯 蒂 格 蔓 指 出 这 一 点 有 重大 意义 , 因 
为 它 排 除了 一 个 未 知 参 量 而 使 问题 提 法 简化 了 . 

设 被 测量 的 量 真 值 为 &. = 次 (独立 同 分 布 } 观 测 值 为 式 


人 >， 总 ， 
“于 是 各 次 测量 的 误差 为 一 和 ,一 9,1<isco. 若 用 总 一 二 -去 


> 
估计 8, 其 误 着 为 e 一 二 一 .辛普森 想 要 证 明 的 是 ;在 下 述 意 义 之 


六 
下 ,e 比 单 次 测量 的 误差 e 小 , 即 : 
PllelsR)P( le lS A>0. (13 
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不 等 式 (}) 人 解释 为 ; 相 比 于 ej， le| 取 小 值 的 机 会 更 大 . 昌 然 ,对 一 组 
特定 的 观测 结果 ,lef 比 |e | 大 也 完全 可 能 . 
辛普森 只 对 一 种 极 特殊 的 误差 分 布 通过 计算 证 明了 (1) 式 . 李 
假定 误差 只 能 取 0, 士 1,……, 士 5 这 11 个 人 .至 于 取 这 些 值 的 概率 ， 
则 是 以 在 5 处 最 大 :然后 在 两 边 按 比 例 焉 降 , 直 到 士 6 处 为 0, 印 
已 fei 一 站 一 (6 一 上 | )r，r 一 0, 士 1,…， 士 5， C2) 


其 中 7+ 二 去 . 分 布 如 图 5. 1 所 示 ， 
概率 


图 5. 1 
革 彰 森 取 -一 6. 对 这 一 特例 ,他 算得 
Pilel 所 1)=0.725, Pille lSE1) =0.444， 
Pile|2}=0. 967, Pile |2)==0. 667 ， 
等 等 ,这 验证 了 (1) 式 .这 个 结果 可 视 汶 第 一 次 在 一 个 特定 情况 下 - 
严格 地 以 概率 的 前 度 证 明了 算术 平均 的 优 息 性 .作为 一 般 的 原则 ， 
午 普 森 和 在 其 工作 中 也 所 到 了 有 盟 述 疡 利 路 的 那 一 些 : 他 和 候 宇 了 无 系 
统 误差 ,误差 有 一 个 由 具体 条 件 所 限定 的 界限 ,在 这 界限 内 恢 其 与 
和 相 离 的 增 大 而 递减 .在 具体 计算 此 例 时 ,他 合用 了 现今 我 们 称 之 
为 母国 数 的 方法 . 他 首先 注意 到 ,分布 42) 是 两 个 独立 的 均 要 分 布 


的 登 如 . 因而 误差 和 > 'e 是 12 个 这 样 的 分 布 的 三 加 .而 ye 一 / 


i 


的 概率 , 则 是 果 数 
(Ite) 到 

—6 F(t 

一 证 lop Tt | 
的 洪 开 式 中 一 项 的 系数 ,这 不 难 利 用 二 项 展开 式 求 得 ， 

苇 普 群 进一步 考察 了 图 密 诬 

5.1 中 横 办 上 的 分 点 死 隐 加 
蜜 的 情形 , 它 的 极限 形式 是 一 
个 连续 的 二 角形 分 布 如 赂 5. 
2. 行 底 过 端点 的 坐标 汐 一 a 
和 4, 则 这 分 布 是 两 个 独立 的 


均匀 分 布 R( 一 分, 也) 的 可 


如. 因此 ,n 个 带 这 种 分 布 的 独立 误差 的 香 加 , 即 >1e,, 就 是 24 个 


独立 的 均匀 分 布 R( 一 尺 ,) 的 登 加 . 利用 上 述 母 函数 方法 并 令 


分 点 数目 欧 于 无 穷 , 辛 普 森 算出 了 这 个 分 布 的 形式 , 即 现今 熟知 的 
独立 均 习 分 布 各 的 密 庆 公式 . 

半 普 森 选 择 这 样 一 个 特例 ,显然 是 出 于 计算 上 的 可 能 性 的 考 
庶 . 可 以 猜想 ,当地 经 过 计算 在 这 一 特例 上 证 实 了 (1) 式 时 ,他 可 能 
会 排 测 , 这 个 结果 结 任 何 符 合 上 述 性 质 竟 误差 分 布 ( 对 称 , 随 | 
增 六 而 下 降 ) 痢 会 戌 立 . 对 正 总 误差 这 一 点 显然 . 对 某 些 其 他 党 兄 
分 布 也 可 以 证 明 . 但 蚌 , 如 误差 有 柯 琴 分 布 [ 其 密度 函数 为 
(z(t 十 9) 站; 圳 6 与 e; 同 分 布 而 (1) 式 成 立 等 号 ,人 循 着 这 个 方 
回 :可 以 举 出 使 413 式 不 成 立 的 精子 ( 注 让， 

洽 者 辛 普 禁 这 种 想法 研究 这 个 问题 的 ,还 有 大 数学 家 拉 略 前 
UU.L.Lagrange,1736 一 ]8173)., 他 在 1776 年 发 表 了 一 篇 题 奴 《& 美 


于 取 平 均 方 法 的 有 用 性 …}?# 的 论文 ,考察 了 其 他 一 些 离散 情况 及 个 
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别 的 连续 情况 ;如 误差 有 密度 cla 一 x30(0x|S 和 a} 娄 ccosr(ti17| 
之 二 } 的 情形 . 然而 ,长 时 间 对 这 个 问题 进行 研究 ,用 力 最 勤 的 ,是 


大 数学 家 拉 普 拉 斯 {PP. S.Laplace,1749 一 1827). 下面 来 介绍 他 的 
了 工作. 


SS.3 拉 伍 拉 斯 的 工作 


污 辛 普 森 和 拉 格 并 日 的 途径 不 同 , 拉 普 拉 斯 不 是 先 息 是 一 种 
误差 分 布 然 后 去 设法 证 朋 平 均值 的 优良 性 ,而 是 直 楼 涉及 误差 论 
的 基本 问题 , 即 应 取 垮 祥 的 分 布 为 误 差 作 布 ;以 及 在 决定 了 误差 分 
布 后 ,如何 根 据 示 知 量 8 的 多 次 测量 结果 天, …: 基 。 去 居 计 及 

关于 前 一 个 问题 , 拉 普 拉 斯 也 密度 
是 从 这 样 的 假定 出 发 :误差 密度 了 
语 洋 于 0 对称 ,好 f(t 一 x) 二 (x)， 

且 82 在 字 关外 增 李 时 Fr 下 
降 , 图 5.3 画 出 了 一 个 典型 的 这 种 7 {xX) 
是 数 的 石 尘 支 , 问 题 是 这 种 盟 数 很 
名 ,如何 去 决定 其 一 . 按 当 有 时 科 掌 界 
流行 的 做 法 ,一 切 都 应 当 尽 可 能 从 
某 种 “tfirst prinacipte72” 出 发 ., 拉 普 拉 图 5.3 
斯 这 样 推理 ;由 于 x 一 上 0 时 FT, 随 着 工 的 增 骨 曲线 六 rr) 商 
来 合 平 组 .因此 其 下 降 率 , 苑 一 疡 (rz) ,也 应 随 工 增加 而 下 降 . 另 一 
方面 ,AKCzr) 本 身 也 是 随 工 增加 丽 下 降 . 拉 普 拉 斯 假定 :一 疡 (rr) 及 
ftzr) 在 下 降 中 总 保持 恒定 比例 , 即 

— (mr ro0, 
22 0 为 前 数 . 上述 方 程 解 出 f(x) 二 ce cr0 为 常数 . 由 
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Fj 得 了 Cr} 二 cece" 当地 < 拉 人 ,再 击 
| 天 (本 一】 


p++ 
定 出 c 二 让 .于 


于 是 得 到 


PE Oi 


f(r) se "Co, (3) 


这 就 是 拉 普 拉 斯 给 出 的 误差 分 布 密度 , 它 在 误差 理论 中 没有 起 到 
什么 作用, 但 是 这 个 分 布 却 以 拉 普 术 斯 分 布 的 名 称 流 传 下 来 . 有 了 时 
也 把 这 个 分 布 称 为 重 指 数 分 布 (double exponential}; 大 概 是 因 
为 ,通常 的 指数 分 布 限 于 70 的 一 边 , 而 这 个 分 布 是 了 全 6 和 .rz 所 
0 两 边 剖 是 指数 . 拉 普 控 斯 引进 这 一 分 布 的 时 间 是 1772 人 年. 
得 出 了 误差 窗 度 (3), 拉 普 拉 斯 就 着 手 和 解决 通过 8 的 观测 值 

式 1 1 去 和 售 诗 的 问题 . 这 里 首先 要 姓 理 的 是 方法 问题 一 一 要 
记 和 住 ,现今 我 们 熟知 的 一 些 点 估计 方法 ,如 和 矩 佑 计 和 极 大 似 然 佑 计 
之 类 ,当时 部 还 设 有 . 拉 普 拉 斯 处 理 这 个 向 题 是 基于 他 的 “不 充分 
推理 "的 原则 ,这 在 秆 3 音 中 已 有 介绍 ， 其 要 点 是 : 茶 di 4 是 
等 可 能 事件 , 构 或 一 个 完备 事件 群 , 则 对 任 一 事件 吾 , 有 

PiA|EYCP(E|A,), (4) 
POA,|E 
PGT ;与 无关， 
设 被 测 的 量 真 值 冯 #8, 误差 密 上 度 为 了 生 则 观测 2 得 到 值 > 的 概 


Ee | 一 办 此 ,nn 次 独立 观测 得 到 值 人 的 概 
训 ， Ei 


好 比值 


FR Fr 0 fCX,—0) (5) 
成 比例 . 按 “ 间 等 无 知 " 的 假定 :8 取 各 种 值 的 先 验 机 会 看 成 等 可 
能 . 于 是 按 不 充分 推理 原则 (4) ,在 得 到 样本 六,…,X, 后 ,8 取 各 
种 值 的 后 验 概率 01X 9 : 瑟 ), 应 与 (5) 成 比例 ， 
HOKU KI OKR Of R,—0), 
即 
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一 人 一 人 

| TT Fez wd 
为 利用 后 验 分 布 46) 去 估计 5. 拉 普 拉 斯 提出 了 两 个 原则 . 一 是 “ 均 
概 ” 原 则 , 即 在 估计 值 6 两 边 ,8 的 概率 相同 , 即 


| (6) 


6 ee 
| /YIxX, ,Rd = | fe IR, ,KX dP = 二 


C7) 
男 一 个 原则 是 绝对 平均 误差 最 小 ; 记 


M0) = | OF, ,Xd, 


有 有 M(B8 ) 二 minM (8). 后 来 他 发 现 ,这 两 个 原则 是 一 回 事 ,二 者 所 


决定 的 估计 (8 ) 相 同 . 今日 在 初等 概率 教 本 中 都 可 以 见 到 这 个 事 
实 的 证 明 . 

现在 要 把 了 的 表达 式 (3) 代 入 (7) 而 解 出 (86 ). 在 这 个 问题 上 
拉 普 拉 斯 遇 到 了 麻烦 . 他 所 以 只 考虑 了 nm 一 3 的 情况 . 即使 对 这 和 
一 个 简单 的 情况 ,计算 也 颇 不 易 , 解 的 形式 也 不 简洁 . 例如 ,不妨 设 
六 之 让 :之 芝 ;; 则 在 这 2 一 和 | 六 4 一 疏 ， 时 ,和解 为 


一 Xe 十 mm ‘log| 1+ expC—m(X,— XL)) 


— 寺 expC~— m(Xs— Xa}, 


不 仪 如 此 ,这 里 还 有 一 个 待定 系数 莒 的 问题 ,对 此 , 拉 普 拉 斯 又 动 
用 “不 充分 推理 原则 ”并 对 mw 作 “ 辣 等 元 知 ” 的 假定 ,最 后 搞 出 一 个 
极其 复杂 的 方程 ,就 是 对 = 一 3 的 情况 也 难以 对 付 . 

这 梓 , 论 春 这 条 路 线 油 能 得 出 什么 有 用 的 针 果 .以 上 的 工作 拉 
尊 拉 斯 作 于 1772 年 一 1774 年 ,他 自己 也 认为 所 给 的 解法 不 能 令 
人 满意 . 以 后 他 还 曾 继 镇 沿 着 这 条 路 线 研 究 本 问题 ,例如 在 1777 
年 ,他 从 某 种 奇特 的 考 虚 出 发 ,提出 以 
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7Gz) 一 (2a) logCTri)， | 和 a a0 (8) 


(fr 当 |zl 全 4) 为 保 善 密度 .他 花 了 凡生 页 的 篇 申 去 论证 公 
起 48) 的 根据 ,但 他 也 了 解 :这 个 公式 形状 太 不 平常 ,不 可 能 有 何 实 
奈 的 应 用 .实际 上 ,与 (3) 相 比 ,C8) 这 个 形式 可 以 说 离 题 更 远 , 以 至 
今日 的 概率 教科 书 上 都 不 提 到 它 , 不 像 43) 还 留 下 了 一 个 拉 普 拉 斯 
分 布 的 名 称 . 

至 此 , 终 18 挝 纪 ., 可 以 说 ,寻找 误差 分 布 的 问题 ,依旧 进展 其 
徽 . 现在 辊 到 高 斯 出 场 . 出 人 意料 的 是 ,他 以 税 其 简单 的 手法 ,给 了 
这 个 问题 一 个 完满 的 解决 ,其 结果 成 为 数理 统计 发 展 史 上 的 一 块 
里 程 健 . 


3 5.4 高 斯 导出 误差 正 态 分 布 


1803 年 ,高 斯 (Carl Friedrich Gauss,1777 一 1855) 发 表 了 其 
数学 和 天 体力 学 的 名 著 《 绕 日 天 体 运 动 的 理论 》. 在 此 书 表 尾 ,他 和 写 
J 一 人 往 有 基数 据 结 合 ”(data combination) 的 间 题 ,实际 涉及 的 就 
是 这 个 并 差分 布 的 确定 癌 题 。 

设 具 但 为 8,n 个 独立 测量 值 为 XXX 高 斯 把 后 者 的 概率 
取 为 

A= KR OOR,—0), (C9) 
其 中 广 为 待 定 的 误差 密度 卫 数 . 到 此 为 止 他 的 作法 与 拉 普 近 斯 相 
同 .但 在 往 下 进行 时 ,他 提出 了 两 个 创新 的 想法 . 

一 是 他 不 采取 内 叶 斯 式 的 挫 理 方式 ,而 径直 把 使 (9) 式 达到 最 

大 的 一 9 (XXX 作为 8 的 估计 ,即使 
LB ) 一 maxZ(B) (10) 


llz 


成 立 的 8 .更 在 我 们 把 工 (8) 称 为 样本 叉 ,,…, 尺 , 的 似 然 函数 ,而 


把 满足 (10}) 式 的 8 称 为 8 的 极 大 做 然 佑 计 . 这 个 称呼 是 追随 费 砍 
和 尔 ,因为 他 在 1912 年 发 表 的 一 篇 文章 中 ,明确 担 到 以 上 概念 并 非 
针对 一 般 参 数 的 情形 . 

如 果 拉 普 拉 斯 采用 了 高 斯 这 个 想法 , 那 他 会 得 出 {在 已 定 误差 
帘 度 (3) 的 基础 上 )8 的 慷 计 是 天 :天 ,的 中 位 数 medf 
大 ,出 克 有 按 术 小 排列 后 于 正中 的 那 一 个 (x 为 奇数 时 )， 
或 十 于 正中 那 两 个 的 算术 平均 (Cn 六 偶数 时 }. 这 个 解 不 仅 计 算 容 
易 , 且 在 实际 意义 上 ,有 时 比 算术 平均 六 更 合理 . 不 过 ,即使 这 样 ， 
科普 拉 斯 的 误差 分 布 (43)? 大 概 也 不 可能 取得 高 斯 正 态 误差 那样 的 
地 位 . 原因 是 下 是 线性 函数 ,在 正 态 总 体 下 有 完善 的 小 样本 理论 ， 
而 med(X 要 用 于 推断 就 难于 处 理 . 另外 ,这 里 所 谈 的 是 
一 个 符 定 的 问题 一 一 随机 测量 误差 该 有 如 和 何 的 分 布 .测量 误差 是 
由 诸多 因素 形成 ,每 种 因素 影响 都 不 太 . 按 中 心 极 服 定理 ,其 分 布 
近似 于 正 态 是 势 所 必然 .其实 , 早 在 1789 年 左右 , 拉 普 拉 斯 就 推广 
了 犹 欧 弗 的 结果 ,得 到 了 中 心 极 服 定理 的 比较 一 般 的 形 趟 ,可惜 的 
是 ,他 未 能 把 这 一 成 果 用 到 确定 误差 分 布 的 癌 题 上 来 . 

局 斯 的 第 二 点 创新 的 想法 是 ;他 把 问题 便 过 来 , 先 承 认 算 术 平 
均 XX 是 记 到 的 估计 ,然后 去 找 误差 密度 尔 数 fF 以 迎合 这 一 点 , 即 
我 这 样 的 上 ,使 由 (10? 式 决定 的 日 就 是 现 , 高 斯 证 明 ( 注 2);, 这 只 
有 在 
-re C11) 
才能 成 立 , 这 里 上 >0 是 常数 ,这 就 是 正 访 分 布 N (0,h). 

使 用 这 个 误差 分 布 ,就 容易 对 最 小 二 乘法 给 出 一 种 解释 . 回 到 
第 四 章 的 方程 (3) ,其 中 (ro ,5c0) ,1 二 1,-… ns, 是 观测 数据 . 记 

2, Kw. 
按理 论 它 们 应 为 0, 但 内 有 测量 误差 存 在 ,实际 不 必 为 0, 故 ee-， 
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Eh 


tr)= 


,可 视 为 误差 . 按 高 斯 的 第 一 个 原则 ( 极 大 似 热 ) 缩合 误差 密度 
(113,fcelewye 的 概率 为 


Cv Eih) "exp 一 区、 2 CT 上 


要 此 式 达 刘 最 天 :必须 取 所: 上 之 但 ， 使 表达 式 》) (zo 十 六 


十 下 十 zw) 达到 最 小 ,于 是 得 到 如 ,…… 贞 的 最 小 二 先知 计 . 要 广 
意 的 是 ,这 一 点 与 待定 各 数 乒 之 值 匹 基 . 

高 斯 这 项 工作 对 后 世 的 影 狗 极 太 , 它 使 正 态 分 布 同时 有 了 ”高 
斯 荔 布 "的 名 称 , 且 如 第 七 章 曾 指出 的 ,后 世 之 所 以 老将 最 小 二 乘 
法 的 发 明 权 归 之 于 他 ,也 是 出 于 这 一 工作 . 高 斯 是 一 个 上 桂 天 的 数学 
家 ,重要 的 贡献 不 腑 枚 举 .但 现今 德国 10 马克 的 印 有 高 斯 头像 的 
钞 奈 ,其 上 还 印 有 正 态 分 布 Nitin,o ) 的 窗 认 曲线. 这 传达 了 一 种 想 
法 :在 上 喜 斯 的 一 切 科学 页 献 中 ,其 对 人 类 文明 影响 最 太 者 ,就 是 这 
一 项 . 

在 高 斯 刚 作 出 这 个 发 现 之 初 ,也 许 估 N 们 还 只 能 从 其 理论 的 篇 
化 上 来 评价 其 优越 性 ,其 全 部 影响 还 不 能 充分 看 出 来 . 这 要 到 20 
世纪 正 态 小 样本 理论 充分 发 展 起 来 以 后 ， 

拉 营 拉 斯 很 快 得 知 高 斯 的 工作 .并 马上 将 其 与 他 发 现 的 中 心 
极限 定理 联系 起 来 . 为 此 ,他 在 即将 发 表 的 一 箱 文 章 { 发 表 于 1810 
和 牛 ) 上 加 上 了 一 点 补充 ,指出 如 若 误 差 可 看 成 许多 量 的 秋 加 , 则 根 
据 他 的 中 心 极限 定理 , 则 误差 理应 有 高 斯 分 布 . 这 是 历史 上 第 一 次 
可 到 所 请 “元 误 差 学 说 "- 一 -误差 是 由 大 量 的 .由 种 种 康 因 产生 的 
元 庶 莽 全 如 而 成 . 后 来 到 1837 年 , 海 根 (4G. Hagen) 在 一 篇 论文 中 
正式 提出 了 这 个 党 说 ,其实 ,他 提出 的 形式 有 相当 大 的 局 限 性 : 海 
根 把 误 盖 人 谎 想 成 个 数 很 多 的 .独立 间 分 布 的 “元 误 善 "3 ,上 之 


和 ,每 个 志 只 取 土 a 两 值 ,其 概率 都 是 计 , 由 此 出 发 , 按 狭 货 弗 的 中 
心 极限 定 埋 , 立 即 就 得 出 误 盖 (近似 地 最 内 正 态 分 布 . 


拉 普 拉 斯 所 指出 的 这 一 点 有 重大 的 意义 ,在 于 它 给 误差 的 正 
ild 


态 理 论 一 个 更 自然 合理 ,更 令 人 信服 的 解释 . 因为 ,高 斯 的 说 法 有 
一 太 往 环 论证 的 气味 :由 于 算术 平均 是 优 民 的 ,推出 误差 必须 服从 
正 态 分 布 ; 反 过 来 ,由 后 一 绪论 又 推出 算术 平均 及 最 小 二 乘 信 计 的 
优良 性 ; 破 必 须 认 定 这 二 者 之 一 (算术 平均 的 优良 性 ;误差 的 正 态 
性 ) 为 出 发 所 .但 算术 平均 到 底 并 和 没有 自行 戌 辽 的 理由 ;以 它 作 为 
理论 中 一 个 预 设 的 出 发 点 , 终 觉 有 其 不 足 之 处 . 拉 普 拉 斯 的 理论 把 
这 断裂 的 一 环 连 接 起 来 ,使 之 成 为 一 个 和 谐 的 整体 , 实 有 着 极 重大 
的 意 福 . 


SS.S 多 维 正 态 分 布 


才 维 正 态 密度 的 一 个 特例, 最 早 抑 于 1776 年 拉 格 朗 日 的 著 
作 ,他 是 因 和 研究 多 项 分 布 概率 的 极限 而 得 出 这 一 形式 的 . 1812 年 
拉 普 拉 斯 在 其 名 著 《 靶 率 的 分 析 理 论 ?》 中 ,从 讨论 最 小 二 惕 估计 的 
联合 极限 分 布 , 世 导出 多维 正 态 密度 男 数 . 但 这 些 如 同 狄 莫 弗 的 结 
洒 那 桩 ,只 是 作为 一 个 数学 范 数 的 名 义 提 出 来 ,不 具备 客 维 随机 变 
莽 的 桥 率 分 布 的 与 份 . 

案 泡 正 态 分 布 以 密 个 随机 变 莉 的 联合 分 布 的 身分 出 现 , 最 增 
出 是 在 抽 量 误差 领域 .一 种 说 法 认为 这 最 早 见 于 1846 年 布 拉 瑟 依 
斯 发 表 的 一 篇 文章 , 几 现 代 的 记号 ,他 的 间 题 可 表述 如 下 ; 设 

Y= fi RD, i= 2 

是 一 些 由 “直接 观测 值 ” 蕊 ss 所 决定 的 间接 观测 值 ”, 六 |， 
“独立 ,变量 XX; 服从 正 态 分 布 Nia,, 习 ) ,要 决定 (YY, ,YY，) 
的 联合 分 布 . 布 拉 瓦 依 斯 只 讨论 了 mx 二 2 和 3 的 情况 . 方法 和 如下， 
内 ce 三 六 ,一 a, 是 误 芋 ,其 什 很 小 ;区 近似 地 有 


2, = YY, 让 CC 一 六 ,eli， 一 一 ] 2， 


+™ 1 
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这 里 本 ,是 fr 本 时 人 重 秆 数 在 5el "~ :a ) 碟 处 之 从 ,ee 3 
en 外相: 且 e; 有 人 分布 入 (C0. 认 ). 以 此 为 出 发 虚 , 经 过 一 些 运 算 ， 


他 导出 CY, 了 ;} 的 联合 分 布 密度 函数 为 
1 >， ， re )- 


hs 


| yi As 2y, ys VALAs, YA 
J=1 
exp C12) 
> (局 ax 一 A | 


hs 


这 里 一 (24) ,> 表示 对 了 一 1 天 下 求 和 .可 异 的 
是 . 布 拉 瑟 依 斯 停留 在 这 一 步 , 没 有 化 简 到 能 过 YY,,Y, 的 二 阶 矩 表 
达 的 式 子 .现在 容易 通过 简单 计算 证 明 ; 车 以 5 和 og 分 别 记 立 ， 利 
Y, 的 方差 ,P 记 其 相关 系数 , 则 上 式 化 为 我 们 现在 熟悉 的 形式 
1 ! pp] Ya 2 
ep 201— po:) pt | 
C13) 
对 吉 二 3, 布 拉 甩 依 斯 用 类 似 方 法 得 出 了 GT 六 7 的 联 会 分布 
苇 形 式 类 似 (127 侣 更 复杂 . 
到 和 砂 “上 应 角 进 存 1920 年 写 了 一 篇 题 为 4 相关 的 坊 束 注 记 》 的 
艾 章 , 其 中 对 布控 瓦 依 斯 的 上 述 工 作 的 评价 不 高 . 按 皮 尔 逊 的 意 
见 , 基 过 间接 观测 值 导出 正 态 分 布 的 作法 ,在 高 斯 1823 年 出 版 的 
数据 结合 理论 3》 中 己 有 了 , 且 是 对 一 般 的 mw; 而 布 拉 瑟 依 斯 只 考虑 
了 和 二 25. 元 其 重要 的 是 , 布 拉 瓦 依 斯 未 能 通过 变量 的 矩 去 取代 
(2 中 那些 复杂 的 系数 组 合 , 这 使 他 与 回 妇 相关 的 发 现 无 缘 . 
人 至 于 市 元 正太 作为 “统计 数据 沁 匈 前 面 埃 其 兹 斯 的 解释 ] 的 模 
弄 提 出 来 ,时 间 晚 了 很 多 . 1885 年 高 尔 登 ( 在 数学 家 狄 克 逊 的 帮助 


下 ,多 第 七 章 ) 实 际 上 已 得 出 了 二 元 正 态 密度 的 一 般 形 式 , 写 法 与 
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(13} 有 所 不 同 . 对 一 般 m 元 的 情 帝 ,是 埃 其 温 斯 于 1892 年 在 其 题 
为 《相关 的 平均 什 》 中 提出 的 . 他 把 多 元 正 态 密度 (期 望 为 0) 的 形 
式 定义 为 


上 * exp| 一 Da xy) | (14) 


其 中 cc 半 0 为 常数， A Ca, 站 为 m 阶 正 定 方 阵 . 他 取 这 个 形式 的 理 
由 是 :假如 5 的 每 一 个 分 量 有 均值 0 的 正 态 分 布 ( 而 正 
态 分 布 在 一 维 统计 数据 中 常 取 为 模型 ), 则 (XX,,…,X，) 必 有 分 布 
《14). 后 来 他 在 另 一 篇 文章 中 对 这 一 指称 给 了 * 证 明 ” 这 “证 明 ” 当 
然 不 能 令 人 人 满意 ,因为 他 所 指 的 这 个 断言 并 不 成 立 . 

埃 其 深 斯 致力 的 问题 ,是 要 通过 (XX) 的 2 和 阶 和 矩 表达 出 
C1) 中 的 系数 a; 在 芭 = 二 2 的 情况 这 实际 十 已 由 高 尔 登 解决 了 . 埃 
其 混 斯 解 次 了 了 六 一 3 的 情况 并 由 此 猫 到 了 一 般 解 . 按 我 们 现在 习 
用 的 二 号 ,此 解 可 表 六 : 记 oo 一 吾 ( 开 1 7 一 1 注意 已 候 
十 XXX 有 期 望 0) ,4 为 方 阵 (ci ， 刚 


一 到 六 《5 1 

2 
但 把 其 温 斯 使 用 了 一 在 极 复 杂 的 ,难于 理解 有 的 符号 ,把 整个 事情 搞 
得 很 筷 .以致 他 这 一 重要 结果 后 来 沥 没 了 . 用 了 一 种 更 好 的 记号 从 
而 言 先 对 55) 作 出 清楚 证 明 的 ,是 卡尔 .皮尔 避 品 [系列 论文 《 数 


学 用 于 进化 论 }? 之 了 ,18963. 在 他 那个 时 代 , 定 阵 表述 方 浅 还 不 普 
谢 使 用 . 皮 有 水 避 实 际 是 把 (id4) 写 成 


br 
-过 > ,到 沁 (16》 


的 形式 :其 中 玉 是 相关 矩阵 5o 的 行列 式 : 尺 为 其 代数 余子 式 . 他 


cc * EXP 


1 ， 起 宁 , 卡 尔 * 虚 及 进 拒 这 -一 结果 的 忧 先 术 归于 埃 其 强 斯 , 称 之 为 " 埃 其 涯 斯 定 
鱼 … 伯 到 1920 年 导 # 衫 英 的 后 中 往 记 宙 .他 修改 了 这 一 虚 法 , 称 俺 z 埃 ?肯定 未 能 将 此 
问题 的 解 弓 成 一 种 使 "具有 通常 数学 知 说 "的 坑 计 学 家 能 理解 的 形式 ， 


lil? 


一 (27》 Yoon) 1R 3, 

而 这 是 埃 其 深 斯 未 能 局 到 的 . 

卡尔 ， 皮 尔 进 把 (16} 称 汐 “ 正 态 相 关 昌 面 ". 在 他 那 斋 很 重要 
的 有 关 用 拟 合 优 度 检验 的 论 交 中 ,他 就 是 以 这 个 形式 为 出 发 友 
‘ 见 第 九 童 )， 

在 理论 上 ;和 多 元 正 态 分 布 的 重要 意义 还 在 于 :是 万 把 起 初 纯 局 
于 误 益 分 析 的 线性 模型 理论 与 “统计 数据 "的 分 析 询 通 起 来 (参看 
第 七 . 八 章 1. 


SS.6 偏 态 分 布 


终 18 世纪 , 正 访 分 布 并 未 取得 它 后 来 所 占据 的 显赫 地 位 . 它 
只 是 作为 二 项 分 布 的 近似 . 另外 , 那 时 所 涉及 的 统计 数据 分 析 问 
题 ,主要 是 与 二 项 分 布 模型 有 关 . 
随 着 拉 普 拉 斯 中 心 棚 限 定理 与 高 斯 正 态 误差 理论 的 问世 , 情 
况 起 了 很 大 的 变化 .在 这 些 成 果 的 启发 下 ,以 持 特 奈 特 ( 见 第 六 章 ) 
为 代表 的 一 些 统计 学 家 大 量 地 将 这 一 模型 用 于 社会 数据 的 统计 分 
析 .而 这 一 分 布 变 得 大 大 好 有 名 ,以 至 有 些 学 者 认为 19 世纪 是 正 
态 分 布 在 统计 学 中 占 统 治 节 位 的 了 时代 汪 . 1910 年 , 查 利 尔 在 一 篇 论 
交 中 对 此 有 所 评论 . 他 认为 这 一 现象 妨 碍 了 学 者 们 对 问题 作 深 人 
的 考 典 ,一 定 程 度 上 扭曲 了 15 证 纪 和 统计 学 的 发 展 , 他 把 这 上 归 和 营 于 
局 斯 ,说 由 于 他 相信 :在 数据 组 中 观察 到 的 与 正 态 的 偏离 ,往往 是 
由 于 数据 量 不 够 罗 . 现在 看 ,这 个 指责 对 高 斯 不 甚 公 正 , 正 态 分 布 
在 19 世纪 的 流行 , 自 有 其 客观 原因 在 ， 
1 在 一 让 程度 上 ;这 个 论断 在 20 世纪 也 还 有 效 , 但 所 根据 的 理由 与 19 世纪 时 志 


也 相同 .三 20 洪 纪 这 分布 在 统计 学 叫 的 流行 ,一 部 分 原因 尾 有 一 个 基于 它 的 有 效 的 小 
样本 理论 . 
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第 一 , 确 有 有 许多 从 实际 中 来 的 数据 ,可 以 很 好 她 昨 正 态 分 布 去 
氢 合 . 拉 普 拉 斯 和 高 斯 的 理论 是 这 一 现 旬 的 强 有 力 的 根据 . 

第 二 ,在 19 世纪 也 还 是 有 一 些 学 者 注意 到 ,一 组 数据 的 正 访 
性 并 非 是 一 个 可 到 作 当 拟 的 事实 ,而 需要 通过 基 种 方法 去 检验 之 . 
如 科 纳 特 在 1843 年 提出 通过 比较 数据 组 的 均值 与 中 位 数 去 被 验 . 
插 特 系 特 引进 了 一 种 几 正 态 分 布 去 拟 合 数据 的 方法 (网 第 六 童 》， 
通过 对 比 冲 数据 区 间 的 观察 闯 数 与 拟 合 频数 ,去 判断 拟 合 的 效果 


如 何 . 他 并 建设 用 p 关 元 的 二 项 分 布 去 拟 合 偏 态 数据 一 一 这 个 思 


想 后 来 成 为 卡尔 ， 皮尔 还 引进 其 著名 的 曲线 族 的 出 发 点 , 遗传 学 
家 高 尔 登 质 然 是 正 态 分 布 的 信奉 者 (《 见 第 七 章 》, 但 也 指出 在 某 些 
情况 下 非 正 态 的 可 能 ,1879 年 他 曾 引 进 对 数 正 态 分 布 以 刻 划 某 些 
“乘法 规律 "起 作用 的 数据 . 但 所 提 的 检验 方法 , 拿 现 在 的 眼光 看 都 
属 粗糙 , 且 缺 乏 其 可 入 度 的 概率 分 析 . 因此 在 多 数 情况 下 ,使 用 这 
些 方 法 去 检验 数据 的 正 态 性 ,结果 要 人 么 是 拟 合 比 较 好 ,要 么 是 在 疑 
似 之 间 . 起 不 了 多 大 作用 ,甚或 可 能 还 夸大 了 正 态 的 无 所 不 在 社 . 
到 19 世纪 后 期 ,数据 与 正 态 氢 合 不 好 的 情况 日 渐 为 人 所 注 
意 , 因 而 也 促使 人 们 去 研究 这 种 * 偏 态 数 据 " 的 分 布 问题 . 此 种 研究 
的 出 发 点 有 二 :一 是 从 测量 误差 的 角度 看 ,一 是 从 一 般 的 统计 数据 
《如 一 群 入 身高 的 值 ) 的 角度 看 . 这 种 分 野 有 其 历史 原因 , 艺 前 面 棋 
及 的 在 19 志 纪 中 ,误差 分 析 与 统计 学 被 视 为 两 个 不 同 的 领域 的 看 
法 . 例如 , 述 至 1885 年 , 埃 其 湿 斯 在 一 篇 论文 中 还 对 "观察 数据 ”与 
“统计 数据 "之 区 别 加 以 解释 :前 者 是 对 一 个 对 象 的 重复 测量 值 , 面 
后 者 是 一 些 不 周 对 象 (如 一 群 人 的 身高 ) 的 测量 值 . 时 至 今日 ,这 二 
者 已 合 二 而 一 . 如 今 的 统计 学 者 不 下 强调 这 二 者 的 差异 ,因为 处 理 
它们 的 统计 学 原理 和 方法 并 无 二 致 . 当时 因为 尚未 建立 一 个 严整 
的 数理 统计 学 理论 框架 ,使 人 人 们 尚 不 能 充分 看 出 这 二 者 内 在 的 统 
- -性 ， 
从 第 一 种 观点 出 发 研究 此 问题 的 先驱 ,是 格 兰 姆 (18797 和 齐 
了 工 各 


革 . 后 者 在 1903 年 出 版 了 观察 值 的 理论 # 一 书 , 其 中 引进 广 半 不 
变量 ”这 个 在 统计 学 中 有 一 定 重 要 意义 的 统计 量 由 . 他 们 的 作法 是 
把 随机 误差 六 的 分 布 表 成 一 个 级 数 , 其 种 一 项 为 正 态 分 布 , 以 后 
的 项 则 视 为 由 斑 的 非 正 态 性 而 带 来 的 休 正 . 季 们 的 区 法 由 查 利 尔 
所 发 扬 . 他 在 1905 年 及 随后 若干 年 发 表 的 一 些 论 文中 ,推进 了 这 
一 方法 特别 是 论证 了 其 监 伍 性 问题 , 虽 则 其 证 明 是 错 的 . 他 并 用 所 
得 出 的 分 布 形 式 去 所 合 一 些 从 实际 问 晤 中 得 来 的 数据 . 

查 利 穴 从 推广 海 根 的 * 元 误 盖 假说 ”(Phypothesis of elemen- 
tary exrTrorsy 出 发 ,把 误差 天 表 为 有 限 个 来 源 的 误差 羡 /,… ,天 , 之 
和 - 瘤 根 怕 来 限制 每 人 小 只 能 取 两 个 值 士 ,而 查 和 尔 则 推广 为 
六 , 本 以 有 一 般 的 分 布 . 将 羡 标 淮 化 (期 望 0 方差 1), 应 用 拉 普 拉 
斯 的 分 析 方 法 , 查 利 尔 得 到 XX 的 密度 图 数 三 和 分 布 函 孝 下 分 别 展 
成 级 数 的 形式 ， 


DA Cr) 
r=gr) iT 


1 


(17) 


2 Br) 

TD) 二 古语 一 一 C1R) 
其 中 和 人 旬 分 别 是 标准 正 态 N00,1) 的 密度 和 分 布 色 数 , 而 #2? 和 
中 "人 刘 是 其 i 阶 导 数 , 系数 4, 可 通过 不 的 半 不 变量 {因而 短 ) 表 
出 . 最 初 上 几 个 系数 是 :A 二 (一 7 一 3,45; A 二 此 十 1082, 丰 为 j 

阶 半 不 变量 . 
缓 数 (47)、 (18) 称 为 棕 兰 姆 一 查 利 尔 级 数 . 在 实际 应 用 中 , 希 
望 在 只 取 该 级 数 少 数 几 项 的 情况 下 ,得 到 与 数据 较 好 的 氢 侣 (一 般 
只 取 其 :一 3 或 ;一 3.4 两 项 ). 然而 ,在 现在 棕 兰 姆 一 查 利 尔 级 数 


加 忆 半 不 灾 量 的 定 交 是 ; 设 随 机 变量 X 有 特征 本 数 sx). 特 logef 世 展 为 笑 手 


数 之 一 , 则 训 称 为 区 的 1 瞪 半 不 变量 , 它 可 以 通过 无 的 拭 表 出。 


:=1 J2! 
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已 系 大 为 大 们 所 提 及 ,因为 它 被 另 一 个 与 之 相似 的 .被 称 为 “ 玫 其 
湿 斯 展开 ”的 级 数 所 取代 .后 者 是 到 其 谴 斯 在 1905 年 一 篇 论文 中 
得 出 的 ,缘由 如 下 :和 天 点 一 上 1 十 十 发。 而 考 虚 人 独立 同 
分 布 的 情况 , 则 按 中 心 极 眼 定理 , 蕊 (经 过 标准 化 ?的 分 布 当 关 很 大 
时 应 接近 正 态 ,这 意味 着 在 展开 式 (17), 18} 中 ,系数 4 之 3 应 
随 x 一 2. 而 趋 于 0. 事实 上 ,简单 计算 显示 ,每 个 4 都 是 由 n-7， 
zi 等 的 一 些 线性 组 合 构成 . 问题 在 于 ,这 数量 级 并 非 随 ; 
增加 而 增加 . 例如 ,A; 为 x- 的 量 级 ,A,,As 为 n-! 的 量 级 ,A 、A;，、 


A 为 n 习 的 量 级 ,等 等 . 埃 其 尖 斯 把 级 数 (17)、(18) 加 以 改造 , 提 
出 一 个 形 如 


F(x) 一 加 (rr) » ni, Cr) (19) 
F=:| 


本 展 开 式 , 即 埃 其 湿 斯 新 近 展 开 { 记 处 为 罕 出 矶 一 碟 | 十 … 十 互 
的 分 布 与 # 的 关系 ;已 将 其 分 布 记 为 记 .(7)) 这 里 恕 (Cry 是 @ 呈 ， 
中 ”中 某 些 个 的 线性 组 侣 ,其 系数 不 依赖 由 ,具体 形式 很 复杂 ， 
不 芷 此 写 出 . 对 (19) 式 , 不 是 讲求 其 级 数 的 收 令 性 ,而 是 指 : 若 右 


边 的 级 数 取 mw 项 , 即 用 中 Cz) -3 Wn- 了 Q(z) 作为 Cx) 的 近似 ， 


则 误差 属于 0(n-#) 的 数量 级 . 当然 ,要 这 个 事实 成 立 ,需要 一 定 的 
条 件 . 这 不 仅 对 独 立 癌 分布 和 ,对 一 般 的 新 近 于 正 态 分 布 的 统计 
量 , 都 可 写 出 形 如 (19) 的 渐 近 展开 式 并 研究 上 述 事实 成 立 的 条 
件 . 这 种 问题 很 难 , 上 且 前 只 对 独立 和 ( 闻 分 布 或 否 ) 的 情况 有 了 上 比 
较 彻 底 的 结果 . 对 埃 其 湿 斯 展开 的 研究 主要 出 于 纯 理 论 的 兴趣 ,从 
其 作为 中 心 极 限定 理 的 精确 化 这 个 角度 来 看 待 , 而 未 是 把 它 作 为 
数据 的 统计 分 析 的 实用 工具 来 看 待 . 

卡尔 * 皮尔 于 研究 这 个 问题 ,是 为 了 一 种 纯 实 用 的 目的 , 即 找 
出 一 些 分 布 去 拟 合 从 实际 问题 中 来 的 数据 ,以便 在 正 态 分 布 不 适 
用 时 可 供 选 择 使 用 . 他 这 项 工作 进行 于 1892 年 一 1895 年 ,成 果 以 
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《数学 用 于 进化 论 》 为 总 题目 发 表 出 来 (主要 是 这 组 论文 的 1 入， 
分 别 发 表 于 1893 年 和 1895 年 ). 

甘于 卡尔 ， 皮尔 带 研 究 这 个 问题 的 动机 ,在 季 去 世 后 ,他 的 此 
于 爱 根 ， 皮尔 各 1938 年 在 一 篇 纪念 文章 中 ,有 一 段 话 谈 到 他 父亲 
基期 的 工作 :“ 在 (19 世纪)90 年 代 , 关 于 进化 和 寻 传 的 生物 计量 研 
究 时 沉 受 到 阻碍 ,因为 统计 学 理论 的 研究 跟 不 上 步伐 . “在 卡尔 。 
皮尔 各 〉 腿 里 ,统计 学 关心 的 基本 问题 是 “由 过 去 预测 未 来 ”, 所 殴 要 
的 是 一 种 方法 ,能 把 观测 所 得 数据 转化 为 一 个 预测 模型 . 他 解决 这 
个 问题 的 做 法 是 发 展 出 一 族 上 曲线 + ,去 拆 合 所 更 察 到 的 生物 数据 . 
这 里 切入 我 们 当下 讨论 的 问题 . 不 这 ,最初 把 皮尔 人 地 的 注意 力 引 向 
这 个 方面 的 ,还 是 当时 的 一 个 偶发 事件 . 1892 年 ,动物 学 家 兼 生 物 
统计 学 家 威 尔 登 (他 与 高 尔 登 .上 度 尔 避 等 人 有 联系 ) 测 量 了 一 些 “ 那 
波 里 盘 " 的 体 宽 ,得 到 一 个 双 峰 分 布 . 他 党 得 这 有 些 不 平常 ,将 其 发 
现 告 类 了 皮尔 名 等 人 .皮尔 避让 为 可 能 是 两 个 正 态 分 布 的 混合 ,他 
企图 用 形 如 
= ei 二 (le) = ee 20 
去 拟人 台 访 组 数据 . 这 里 涉及 5 个 未 知 和 参数 :c{ 在 0,1 之 间 }》 ,a as、 
ao 和 as. 他 提出 用 邱 法 来 处 理 这 个 问题 , 即 计 算数 据 的 前 5 阶 矩 ， 
让 它们 等 于 由 分 布 420) 算 出 的 对 应 阶 矩 ,从 所 得 方程 组 解 出 这 5 
个 套 煞 .这 涉及 很 高 阶 的 方程 ,在 当时 的 条 件 下 不 易 处 理 . 值得 注 
意 的 里 ,这 是 皮尔 避 第 一 次 使 用 矩 法 去 估计 分 布 参 数 , 这 个 方法 至 
今 在 数理 统计 学 中 仍 很 常用 ,是 卡尔 ， 皮尔 避 对 数理 统计 方法 的 
重要 贡献 之 一 . 

到 1893 年 , 倡 开始 研究 一 般 的 偏 态 分 布 问题 . 最 初 (1893) 发 
表 的 是 以 他 名 字 傅 名 的 分 布 族 中 的 一 个 特例 一 一 皮尔 人 进 夏 弄 , 现 


tT} 


山 此 和 不 进 分 布 都 有 概率 密度 函数 ,后 者 在 坐标 平面 上 的 图 形 为 曲线 , 即 上 应 尔 还 曲 
线 , 在 文献 中 光度 尔 下 分 布 * 与 “皮尔 下 曲线 ”这 两 个 名 词 并 存 不 庶 、 


le 
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今 我 们 叫做 "YtGamma) 分 布 访 ”, 或 者 说 ;自由 度 不 必 为 整数 的 让 
分 布 族 . 他 把 这 称 为 “ 正 态 曲线 的 推广 形式 ,具有 非 对 称 的 性 质 ” 
这 分 布 的 标准 形式 为 : 


B+] 
0 
天 (一 ee < 一 


FFT 21) 
a 一 0; 六 一 ] 为 参数 . 这 本 怕 是 皮尔 吉 族 中 除 正 态 而 外 ,在 统计 学 
上 最 重要 的 分 布 , 用 于 很 多 现象 的 模型 . 其 28=0 的 特例 , 即 指数 


分 布 , 在 应 用 上 尤为 重要 . 应 提 及 的 是 ;此 分 布 在 a 一 方 'B 一 均一 1 


tn 为 是 然 数 ) 时 , 即 自由 度 n 的 习 分 布 ,是 在 此 前 人 们 已 知 的 .这 
本 和 草 前 面 已 担 及 , 另外 ,一 位 美国 学 者 法 雷 斯 特 在 1882 年 一 1883 
年 时 已 提出 了 这 一 分 布 ,皮尔 还 当时 不 了 解 这 一 点 .皮尔 和 提出 这 


个 分 布 是 为 了 氢 合 偏 态 (p 关 亏 ) 的 二 项 分 布 . 


紧 接着 在 1895 年 ,皮尔 各 发 表 了 其 依据 二 项 分 布 和 超 几 柯 分 
布 而 得 到 的 .他 的 曲线 族 所 满足 的 微分 方程 ( 注 3); 
d 过 全 十 它 
= . ~ (22) 
其 中 eve 为 常数 . 令 这 些 常 数 取 种 种 值 ,可 得 到 种 种 不 同 的 解 ， 
其 全 体 统 称 皮尔 入 曲线 族 . 例如 , 令 4 一 5 二 0,c 二 1,q9 二 0, 可 得 正 
态 分 布 族 ; 邻 0,65 王 4d 二 一 qe 一 户 ; 可 得 对 儿 分 布 (21) 等 
等 . 其 他 统计 学 中 常见 的 重要 分 布 , 如 刀 , 等 分 布 , 无 不 包罗 在 
此 族 内 . 
下 一 步 的 问题 是 如 和 何 根 据 数 据 去 在 此 族 中 选 出 一 个 分 布 ,与 
这 指数 据 有 尽 可 能 好 的 拟 合 . (22) 中 昌 有 5 个 参数 , 因 上 比例 关系 实 
质 上 只 有 4 全 .皮尔 看 用 矩 法 来 确定 这 些 参数 , 即 用 前 4 阶 样 本 算 
与 分 布 的 对 应 阶 和 矩 列 出 方程 ,求解 方程 以 定 出 参数 的 值 了 .1902 年 ， 


“上当 程 (22) 的 解 的 黄体 形式, 取决 于 参数 的 取 值 ,形式 地 种 守 样 . 因此 皮尔 迁 分 
布 可 以 他 出 许 委 型 ,网 分 有 十 玫 种 . 如 解 Te 
型 ,有 3 个 参数 a.8 和 氢 合 时 先 选 定 类 型 , 必 相 时 还 要 指定 其 中 小 列 夭 数 之 傅 . 
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点 未 刘 在 ¢ 和 生物 计量 3》(Biometrika}) 亲 志 上 发 表 了 一 简 论 交 , 在 最 
小 二 乘 的 准则 下 ,解释 了 用 上 矩 法 决定 参数 值 的 道理 ( 注 4)， 
当时 的 学 者 对 皮尔 各 这 一 工作 一 般 都 抱 怀 疑 的 态度 . 理由 主 
要 在 于 ,他 蕉 出 这 个 分 布 族 全 赁 理论 上 的 考虑 . 从 二 项 分 布 出 发 扒 
演出 的 方 称 5227, 其 根据 甚 可 怀疑 . 具 虱 的 批评 又 在 两 个 角度 . 斯 
壤 的 那 维 下 学 派 的 大 物 ,例如 查 利 尔 ,在 其 (数理 统计 学 01910 
年 ) 的 序 育 中 批评 皮尔 进 曲 绕 挟 过 原生 的 (genetic) 根 据 . 他 们 也 批 
评 岂 尔 圳 分布 族 的 导出 没有 与 任何 误差 理论 发 生 联 系 , 该 族 曲 线 
的 概率 背景 ,并 未 能 对 有 关 的 实际 问题 提供 什么 启示 ,而 这 些 实际 
癌 趣 正和 是 这 获 分 布 预定 的 应 用 场合 . 
为 一 种 怀疑 和 和 批评 则 来 自 皮尔 了 迄 周 轿 的 合作 者 , 刀 高 尔 登 . 威 
示 登 等 人 . 商 乐 登 是 皮尔 逊 这 项 工作 的 审 稿 人 ,他 虽然 同意 推荐 发 
表 此 文 并 试 为 在 独创 性 ,但 心中 和 不以为然 ,认为 * 这 组 频率 分 布 律 
是 建立 在 对 (现象 的 ) 原 因 完 全 无 知 的 基础 上 的 ,但 我 们 极 少 是 完 
全 充 知 .什么 时 候 我 们 对 ( 现 和 党) 所 自 有 的 任何 知识 ,当然 都 应 当 被 
等 虑 在 内 ”他 还 认为 ,什么 时 幢 当 正 态 律 不 适用 时 ,最 有 可 能 的 是 
有 某 种 大 的 影响 因素 存在 , 它 应 当 定 分 离 出 来 以 便 进 行 研究 . 威 尔 
登 的 意见 与 高 尔 登 相似 ,但 程度 可 能 更 强烈 一 些 . 存 皮 尔 还 文章 发 
表 的 同年 (1895) 他 有 一 封 致 高 尔 登 的 信 , 鞭 中 有 这样 一 段 ;:“ 关 于 
数学 条 .是 然 的 我 感觉 到 了 你 所 说 的 话 的 分 量 人 合计 高 尔 登 所 说 是 
肯定 数学 家 在 生物 研究 中 的 作用 一 一 引 者 注 ) ,但 我 极其 害怕 那 种 
没有 实验 训练 的 纯粹 数学 家 . " 季 显 然 在 一 定 程度 上 把 皮尔 迁 看 作 
这 类 人 中 的 一 个 . 
该 从 接着 有 很 长 一 段 , 对 皮尔 进 的 分 布 表 示 怀 疑 , 针对 皮尔 示 
拟 合 的 一 组 数据 ,他 认为 那 蚌 因为 其 中 个 体 年 龄 不 同 而 导致 生长 
速度 不 同 , 以致 旦 现 若干 偏 态 . 意思 是 消除 这 些 因 素 后 ,数据 仍 会 
宇 束 正人 态 - 季 批 评 友 尔 忆 曲线 过 分 照顾 了 极端 值 而 使 中 间 大 部 分 
数据 的 拟人 台 变 坏 . 他 自己 主张 的 做 法 是 舍弃 少量 的 极端 值 , 取 其 主 
体 的 大 部 分 数据 而 以 正 态 扳 合 之 一 一 这 与 现今 统计 学 中 删除 异 
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值 的 提 法 -至 .不 过 ,剔除 一 些 数据 也 得 有 一 定 的 根据 . 

皮尔 各 不 为 所 动 . 他 坚持 要 把 全 体 数 据 拿 来 一 起 考虑 . 看 来 这 
场 秆 论 谁 也 没有 说 服 谁 . 

这 里 牵涉 到 一 个 更 深层 次 的 问题 , 即 数 理 统计 学 或 一 般 地 说 
数学 在 研究 实际 间 题 中 所 起 作用 的 看 法 . 如 果皮 尔 进 曲线 是 作为 
一 种 生物 学 规律 扣 出 来 ;认为 某 类 生物 数据 理应 服从 这 种 分 布 , 那 
他 的 理由 显然 不 充足 , 威 尔 登 等 的 批评 是 有 道理 的 . 但 当时 曾 临 的 
情 病 是 , 确 有 一 些 数 据 明 显 与 正 态 有 但 离 且 不 见得 总 是 有 圾 确 无 
误 的 系统 因素 来 解释 . 在 这 种 情况 下 ,皮尔 还 曲线 提供 了 一 种 可 殿 
选择 的 居 法 ,使 用 者 可 以 根据 对 其 实际 问题 的 效果 如 何 来 决定 取 
售 . 数理 统计 方法 仅 是 从 数 甬 的 角度 去 提示 某 种 效应 可 能 存在 或 
否 . 它 不 去 回答 也 不 能 回答 黄 背 后 的 困 果 问题 . 如 果 这 样 看 ,可 以 
认为 庶 秒 吉 曲 线 提 供 了 一 种 有 用 的 工具 ,扩大 了 统计 方法 的 武 库 . 
其 实 人 们 也 多 是 用 这 种 态度 来 看 问题 . 例如 ,根据 特定 问题 的 需 
雪 ,统计 学 家 在 不 同 的 应 用 场 台 使 用 过 请 如 对 数 正 态 分 布 、. 感 布尔 
分 布 和 极 值 分 布 等 不 属于 皮尔 避 族 的 分 布 . 

现今 的 统计 党 著作 对 “皮尔 撑 分 布 " 这 个 和 名词 , 提 得 不 像 在 一 
一 十 年 代 那 么 多 .一 个 理由 是 此 族 中 的 一 些 重 要 分 布 者 有 了 专 虱 . 
但 应 当头 访 , 皮 尔 提 分 布 族 在 统计 学 发 展 史上 有 其 一 定 的 地 位 , 它 
即使 从 理论 的 角度 看 也 起 了 有 益 的 作用 , 一 个 例子 是 基色 特 关 于 
t 个 布 的 著名 论文 均值 的 或 然 误 差 ), 其 中 关于 样本 方差 5 的 分 
布 哥 人 匀 特 未 能 导出 ,而 是 通过 其 矩 与 皮尔 进 分 布 的 矩 比较 而 猜 中 
的 . 费 葡 和 尔 1922 年 首次 引进 下 分布 的 论 交 ,其 中 提 及 有 关 统 计量 
的 分 布 夺 皮尔 和 泛 6 型 ”以 上 这 些 名 家 的 作品 也 反 睦 了 皮尔 避 分 
布 族 在 统计 学 界 的 影响 . 

妨 外 不 能 遗 沁 的 是 ;与 此 项 研究 密 动 联系 的 算 估 计 , 直 到 现今 
仍 是 参数 知 计 中 几 个 通用 方法 之 一 . 

后 来 上 度 尔 避 还 兽 试 图 将 其 方法 推广 到 高 缉 , 以 图 建立 高 维 正 
釜 以 外 的 一 族 高 维 俩 态 分 布 . 这 项 工作 他 关注 了 几 十 年 ,但 没有 取 
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得 天 么 结果 ， 


注 1: (1) 式 不 成 立 的 友人 昼 . 
到 常数 4 ,1 二 a 二 2. 取 误 着 密度 为 
Try=ec (llrl’y '. (Al) 


常数 c 二 | | 《1 二 1x1 tdr] .取样 本 量 ”一 2, 误 差 eves 外 
， “re 2 
立 , 各 有 密度 (Al1) ,以 了 记 Z= 的 密度 函数 ,出 
(OQ) = 4C3| 1 dr 
作 变 换 [二 己 十 x -1!, 可 将 上 式 改 写 为 
gC0) =4c2(1— BCE ,1 i 人 
这 里 8 函数 是 Pa,6) 一 | zx-1(3 一 xz)*'dz. 由 
2c [1 -ra 这 一 】]， 


作 变 换 /二 (1 十 zx*) -i, 可 得 2c.B《 一 
知 


,一 过) 一 1. 由 此 及 (A2) 式 ， 


or 1 
EQ)= 2e,.t1 二 


因 a 二 2, 有 gt) 夺 c 二 0). 由,g 的 连续 性 , 知 存 在 不 汪 0, 使 
Ero< Fr) 当 |>| 扫 上 于 是 (1) 式 不 成 立 . 
此 岗 的 一 点 不 理想 之 处 是 :密度 (AI) 无 数 掌 期 望 . 但 循 着 此 
例 的 想法 不 难 举 出 更 好 的 例子 . 仍 取 aE 11 和 2080 令 
Fat 一 cas 十 | 六 当 |xz| 志 和 M, 
一 避 D， |r| 二 Ni， . {上 3) 
其 余 一 切 照 时 . 则 易 见 当 MM 一 co 时 
了 一人 全)， 
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太 上 上 面 记 证 明了 StO?< 大 00) 灯 当 2 充分 大 时 ,有 gamw(0) 一 
fxt0). 于 是 对 充分 大 的 他, 取 误 差 密度 阴 数 (A3), 冲 和 面 推 理 仿 有 
效 . 在 这 个 误差 密 庶 于 ,误差 召 填 有 叶 : 它 有 各 阶 短 . 


注 2: 由 贾 斯 的 第 2 原则 推出 正 态 分 布 . 
以 了 记 竺 是 的 误差 密 赚 函数 , 记 


f(x) _ dilogf (x) 
BT) = Fry .rc “ ‘A4) 


取 nn 二 2. 按 要 求 , 算 术 平 均 芝 应 满足 

ECKX,—X) ER,—o9)=0. 
内 于 一 雄一 一 ( 写 : 一 让 ), 上 式 可 和 写 为 

大 一 让 一 一 所 (人 (0 = 0. 【 生 5] 
弄 取 一 般 严 , 并 令 关 一 闫 十 1 而 

六 | 二 "一 
则 及 一 0, 而 据 > jg(X, 一 吏 ) = 0, 并 利用 (As) 式 , 得 

一 下 
《全 (全 


对 一 切 日 然 数 澡 及 实数 x. 四 此 ,假定 上 & 连续 *, 即 不 难 推出 8 (IA)= 
cc 亲 菜 话 数 .此 与 (A4) 闭 合 ,; 和 解 出 Fr 一 ec 由 | xdr 


一 1 知 < 应 为 小 于 0 的 常数 . 记 < 一 一 元 ,得 到 (11) 式 . 


注 3: 应 尔 逊 曲线 族 的 推导 . 


中 记 二 项 概率 
一 (产生 '， 4q=1~—p. 
并 把 它 看 作 国 数 > 在 :点 之 值 , 则 差 商 为 
IT ') TI 了 十 中 一 了 一 mh pp 
ECp gq Cpq". 
区 


2 5 . 
两 式 左边 的 比 信 , 即 -Se 一 光 ,可 视 为 函数 艺 C22 在 x 一 :十 二 
> 人 
一 1 十 ) 
处 之 值 . 出 此， 二 过 简单 的 代数 简化 (并 利 有 9 一 1] 一), 易 得 
> - 人 


此 处 利用 了 一 i 十 地 ,并 把 常数 1 二 2p、 志 一 np 和 (Cn 十 1) 思 一 方 分 
别 记 为 a 和 相 世 . 
这 就 是 决定 曲线 yr} 的 方程 . 仅 利 用 二 项 分 布 ,还 不 能 得 出 
最 一 般 的 形式 [正文 (22) 式 ]. 为 得 到 这 个 形式 ,要 利用 超 乒 何 分 布 
站 二 
仿 上 ,计算 y+; 一 及 > 并 求 比值 ,化 简 之 , 令 z 一 上 十 工 ， 
易 得 


t 


vy drite 


Ta 


y dart+hrte’ 
其 中 sie 为 常数 


注 4: 皮 尔 避 的 论据 如 下 :把 曲线 方程 写成 vy 二 (xyesey) 


(二 4). 假定 函数 了 有 足够 阶 的 导数 ,将 了 在 x 一 0 的 邻 域内 展 成 
带 余 项 的 泰勒 级 数 , 有 


一 和 十 ai 十 十 ao 十 是 ， 
Re 是 他 项 + + 都 与 tC] 和 * 有 关 . 


根据 数据 作出 直方 图 , 记 为 yCr).y 可 以 视 为 对 y 的 估计 . 


参数 1 sp 有 p 个 ,ai yn + 有 a 个 ， 假定 这 二 者 之 问 有 过 
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续 一 一 对 应 , 则 ay,… ,a 可 自由 变化 . 现 考 虑 怎 六 选择 c，… 
好 选择 me ,ai 全 表达 式 


H = | yr) — YC Idz 


sp 


达到 最 小 . 考虑 ,并 设 可 在 积分 号 下 求 导 , 则 决定 ,… ,a 的 方 
程 为 


3 mo 间 sR 
二 Bor -一 | Ce) 一 yt.r) tr 十 Ba dx， 
如 
| YI 一 | yy (rT)x'dr — | : Cy) 一 了 了 (03 及 


ar dr 


上 式 左 边 是 分 布 y(z) 的 z 阶 诛 点 矩 ,右边 第 一 项 近似 地 是 样本 ; 
阶 床 点 矩 . 丸 因 为 y 是 y 的 合计 . 右边 第 二 项 很 小 . 故 由 以 上 推理 
得 到 
分 布 y 的 7 阶 原 点 答 症 样本 7 阶 原点 矩 ,i 一 1…, 思 . 

这 表明 ;参数 值 的 选择 近似 地 遵循 总 体 原点 和 矩 等 于 样本 原点 答 的 
规则 . 

从 数学 严 稿 性 的 要 求 看 ,上 述 论 证 可 议 的 地 方 很 多 , 它 实际 上 
不 能 算是 一 个 数 堂 证明, 而 只 是 一 种 启发 性 的 示意 . 值得 注意 的 


是 :皮尔 地 在 此 也 用 了 最 小 二 来 准则 , 即 , 使 太 最 小 . 这样 在 短 法 
与 最 小 二 敢 法 之 间 建 立 了 一 种 联系 . 


ley 


“ 官 刘 统计 "现在 已 经 是 一 个 很 流行 的 名 词 . 广 尖 地 说 , 它 包 合 
国家 所 建立 的 统计 工作 体系 及 其 收集 .整理 .分 析 和 发布 有 关 国 情 
的 数据 资料 的 工作 , 比较 狂 闵 的 含义 就 是 指 官方 (政府 } 所 发 布 的 
统计 资料 ,如 某 一 时 期 经 济 增长 率 种 失业 率 之 类 .在 民间 社会 发 达 
的 败家,-- 些 非 官 方 机 构 , 如 工会 .商会 ,教会 和 大 学 及 专门 学 会 ， 
新 闻 机 构 之 类 ,也 在 特定 的 领域 内 从 事 收集 、 整 理 和 发 布 数 据 的 
工作 ， 

虽然 这 种 工作 只 是 在 近代 随 善 种 种 条 件 的 改进 机 变 得 日 趋 完 
善 ,其 比较 原始 的 形态 一 定 有 着 非常 篮 灸 的 历史 .我 国 圳 籍 中 常见 
有 关于 人 人 口 . 钱 粮 以 此 地震 和 水 旱灾 等 的 记录 .在 西方 , 据 记 载 在 
共和 罗马 时 期 ,4 年 一 度 对 每 个 家 庭 的 人 口 和 财产 进行 普查 登记 ， 
而 奥 吉 斯 都 将 这 种 普查 推广 到 整个 罗马 帝国 , 随 着 后 者 的 衰亡 ,这 = 
种 活动 也 上告 停止 ,直到 18 世纪 才 恢 复 . 当然 ,这 种 活动 与 统计 学 作 
为 一 | 站 学 科 的 建立 还 不 能 划 等 号 ,但 其 促进 作 腹 是 无 可 和 理 认 的 . 学 
省 们 指出 ,现今 通行 的 “统计 学 "(Statistices) 一 词 源 出 于 意 太 利文 
Stato ,其 词根 兼 有 “国家 ”和 “情况 "的 意义 . "统计 学 家 ”Statisti- 
etan7 一 词 源 出 意 区 Statistay 当时 理解 为 ”处理 国务 的 人 ”aa man 
who deals with aifalirs of the statey 统计 学 则 理解 为 对 国务 活动 
上 员 有 兴趣 的 事实 (Ca collection of facts of interest to a 
statesman), 按 这 个 润 义 极 广 的 理解 ,统计 学 就 是 * 国 梢 学”. 这 流 
行 于 16 世纪 的 意大利 ,后 来 传播 到 法 . 德 ,何等 欧陆 国家 . 与 此 相 
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应 ,在 17.18 批 纪 ,这 些 国 家 大 学 中 所 教授 的 名 为 "统计 和 学” 的 诛 
程 ,实际 上 是 “国情 学”, 包括 有 关 人 大口 .经 济 .地理 访 至 政治 方面 的 
内 容 . 经 过 枉 洒 演变 ,到 19 世 纪 初 , 才 基 本 归于 现在 我 们 对 这 党 科 
的 理解 . 卡尔 "皮尔 寺 指 出 ,最 初 在 现代 意 六 上 使 用 "统计 学 "一 词 
的 ,起 莫 国 学 者 辛 克 荣 , 在 共 所 车 The Statlstical Account of 
Scotland 1791 一 1799$ 一 书 中 ， 

大 量 的 原 怒 数据 好 时 不 经 过 整理 ,分 类 .排比 ,分 析 : 并 通过 通 
当 的 形式 表示 出 来 ,就 好 比 一 堆 没 有 经 过 涌 炼 的 矿物 ; 设 有 和 什么 用 
好 .当然 ,收集 数据 总 是 有 其 自 的 . 国 此 可 以 设 条 ,对 数据 进行 整理 
排比 分 本 鸭 工作, 一定 是 从 很 早 岂 来 就 有 人 人 做 了 .但 是 .系统 地 从 
如 这 一 工作 ,有 著作 出 版 并 对 后 世 统 计 学 发 展 有 重大 影响 的 ,要 推 
英国 学 者 格 朗 特 . 他 在 1662 年 以 表 的 * 关 于 死亡 公报 的 自然 和 政 
治 观 察 2 一 书 ( 以 下 简称 ¢ 观 察 》), 是 关于 描述 统计 的 开山 之 作 . 有 
的 学 者 蕊 至 拒 混 书 的 出 版 看 作 统 计 史 的 起 点 . 


36.1 格 朗 特 及 其 《观察 》 


格 朗 特 4jJohn Graunt 1620 一 1674) 是 伦敦 一 家 服装 店主 的 ji 
于 ,开始 在 店 里 帮工 懒 一 名 助手 ,后 来 子孙 父 虹 ,人 必 了 上 店主, 他 有 了 
良好 的 英语 教育 ,并 坚持 不 懈 , 在 每 天 早上 店 鱼 开门 营业 前 坚持 自 
学 法 文 和 拉丁 文 , 这 使 他 成 为 一 位 有 教养 的 纯 士 ,在 一 些 公共 机 构 
中 担任 职务 ,并 在 伦敦 的 文化 和 和 妊 党 圈子 里 结交 了 不 少 朋 太 . 他 其 
至 担任 过 一 段 时 期 的 大 学 音乐 教授 . 但 使 他 留 名 后 世 的 ,还 是 他 的 
篇 幅 为 85 页 的 《观察 ?一 书 . 这 特别 使 他 在 统计 学 史 革 占据 一 个 突 
出 的 地 位 . 当时 的 学 术 界 对 他 这 一 著作 评价 之 高 ,可 以 从 下 述 事 实 
反映 出 来 ;在 此 书 于 1862 年 出 版 后 ,他 立即 被 当年 刚 成 立 的 英国 
皇家 学 会 钥 收 为 会 员 . 当代 统计 学 家 休 伯 ,在 他 于 1997 年 的 一 篇 
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纶 交 中 ,; 画 了 一 条 加 外 扩展 的 螺旋 线 表 示 统 计 学 发 展 的 历程 ;他 把 
格 朗 特 标 在 这 条 螺 线 的 起 点 处 .他 这 本 书 出 了 很 多 版 ,第 二 版 出 更 
站 初版 的 当年 ,第 5 版 在 他 死 后 的 1676 年 ， 
格 朋 特写 这 本 著作 依据 的 资料 ,是 自 1604 年 起 伦敦 教会 每 周 
一 次 发 表 的 "死亡 公报 ?fbiil of morialiiy). 在 19 世 纪 前 :欧洲 因 
饥 饿 .战区 .疾病 等 原因 ,此 其 是 黑 死 病 流 行 的 影响 ,死亡 率 很 高 ， 
这 是 促使 发 表 这 种 公报 的 原因 .该 公报 记录 了 一 周 内 死亡 和 受洗 
癌 t 大 致 是 反映 出 生 上 大 数 ) 的 种 单 .死者 按 死 因 分 类 ,如 1632 年 公 
报 中 包含 63 种 病因 , 按 字 母 次 序 排 列 . 自 1623 年 起 公报 中 男女 分 
开 统 计 . 这 一 批 麻 大 的 数据 ,在 格 朗 特 之 和 前 没有 被 整理 分 析 过 .《 观 
察 》 这 一 善 作 就 是 通过 整理 分 析 这 些 数据 ,对 当时 有 关 伦 敦 的 人 口 
问题 作 册 一 些 论断 . 全 书 分 12 章 .8 个 表 和 结论 . 书 中 上 般 述 了 死亡 
公报 的 起 源 和 发 展 ( 与 当时 黑 红 病 的 流行 有 关 ), 关 于 死因 特别 是 
虹 人 化 病 改 死 人 数 的 统计 ,男女 的 莽 异 ,不 同 教 区 的 差异 , 伦 就 城市 
上 大 口 数 及 其 增长 状况 等 .8 个 表 对 放大 的 数据 做 了 整理 ,是 他 做 出 
惟 断 的 佐 据 .其 中 , 表 1 对 1629 年 一 1636 年 和 1647 年 一 1660 年 
期 间 伦 就 逐年 死亡 人 人 数 , 接 81 类 死因 做 了 分 类 统计 . 表 3 对 
1629 年 一 1664 年 期 疗 伦 就 逐 年 死亡 和 受洗 估 数 按 男 女 分 类 作 了 
统计 . 表 7 对 6 个 黑 死 病 大 流行 的 年 涉 ---1592 年 .1603 年 .1625 
年 .1630 年 .1636 年 和 1665 年 , 伦 训 每 周 琵 亡 总 人 人 数 和 黑 死 病死 
亡 人 数 作 了 统计 . 
根据 这 批 数据 及 其 整理 , 格 郎 特 作 出 了 一 系列 的 推论 . 例如 对 
某 种 实 病 ,他 统计 出 在 1631 年 一 1635 年 的 5 年 期间 有 254 例 死 
天 而 六 3 年 中 死亡 大口 总 煞 为 47 757. 及 往 1656 年 ~-1660 年 的 
5 年 期 间 ,这 两 个 数字 分 别 是 250 和 68 712. 因为 弘 3 二 了 2 
(他 列 约 为 0 003 7 和 0. 005 3), 他 推断 这 种 病 的 死亡 率 有 了 下 
降 . 显然 , 按 我 们 前 几 贡 的 界定 , 格 朗 特 的 工作 属于 描述 统计 的 范 


畴 :他 的 推断 是 建立 在 对 现 有 数据 的 表面 计算 上 ,对 推断 中 的 不 确 
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定性 缺乏 概率 的 分 析 ( 当然 这 是 由 于 当时 的 情况 ,不 是 对 他 的 工作 
的 批评 ). 如 就 上 秽 而 言 ; 现 在 一 位 统计 学 家 会 提出 这 样 的 同 题 :说 
死 广 率 下 降 了 有 多 太 可 党 性 ? 能 否 对 死亡 率 下 降 的 幅度 移出 某 秤 
估计 ?这 类 问题 在 略 朗 特 时 代 无 法 回 管 . 现在 ,用 正 态 分 布 巡 近 二 
项 分 布 的 近 科 ,可 算出 这 个 琵 亡 率 的 下 降 恼 计 在 0. 000 了 和 
0.002 3 之 则 ,作出 这 一 估计 人 可靠 的 程度 为 95 贤 , 即 符 有 5 旺 的 可 
能 性 ,死亡 率 的 下 降 小 于 0. 000 7 或 大 于 0. 002 3. 

现今 的 读者 可 能 赏 得 不 易 理 解 :为 何 这 样 一 些 如 今 看 来 像 是 
一 些 例 行 而 平凡 的 工作 ,在 当时 及 在 统计 中 上 能 获得 如 此 高 的 评 
信 . 这 主要 是 由 于 其 开创 性 一 一 做 了 前 人 没有 想到 .没有 做 的 事 
情 . 其 应 用 起 的 重 太 意义 及 对 学 本 发 展 的 影响 ,下 面 我 们 将 对 此 微 
一 个 简略 的 分 析 . 在 科学 史上 不 少见 这 样 的 例子 ;一 个 意义 重大 的 
发 现 , 一 经 说 厂 ,往往 给 人 一 种 "理所当然 ” 沁 不 足 为 奇 " 及 “为 什么 
早先 没有 作 想 到 ”的 印 得 . 这 正 是 伟 天 的 科学 心灵 异 于 常人 之 处 . 
在 统计 学 果 工 有 不 少 这 样 的 例子 . 

下 面 我 们 来 列举 该 善 作 若 干 主要 的 创新 思想 . 

1. 他 提出 了 “数据 简约 ”Cdata teductiony 的 概念 , 即 把 数量 独 
大 的 杂乱 无 章 的 数据 , 依 种 种 分 类 标准 ,整理 成 一 些 意 义 明晰 的 表 
榈 "数据 图 未 法 在 当时 尚未 发 明 ) ,使 数据 中 包 人 省 的 有 用 信息 能 目 现 
出 来 . 这 样 一 种 思想 ,直到 现今 仍 被 统计 学 家 视 为 基础 性 的 工作 . 

从 书 中 看 出 ,他 也 达到 了 统计 分 析 这 个 基本 概念 . 用 他 的 话说 ， 
是 把 结论 用 很 得 的 ,简洁 的 文字 表达 出 来 . 

2. 他 吉 出 并 举例 处 理 了 数据 的 可 信 性 问题 . 数据 的 可 习性 指 
的 是 : 古 否 有 人 出 于 某 种 月 的 而 对 数据 作 了 自 改 ,或 在 获取 数据 的 
过 程 中 出 块 了 重大 的 失误 ,如 仪器 未 调 淮 或 登录 时 书写 有 误 . 样本 
中 这 样 的 数值 叫做 异常 值 . 鉴别 数据 中 是 否 有 及 何者 可 能 为 异常 
值 ,直到 现今 仍 是 一 个 在 应 用 上 很 重要 ,并 在 方法 研究 上 受到 重视 
的 问题 . 

格 天 竺 分析 的 共性 例子 是 这 样 的 :1603 和 1625 年 都 是 黑 死 
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病 太 流行 的 年 从 . 统计 所 得 1603 年 后 9 个 月 死亡 监 人 人 数 为 
37 294 ,其 中 黑 死 病死 产 人 数 为 30 561, 弘 占 82 败 .1625 年 这 两 个 
数字 分 别 是 51 758 和 和 35 417, 比 率 为 68% ,显著 降低 了 . 另 一 方 
看 , 格 表 特 从 这 两 年 的 受洗 人 数 维 知 , 该 两 年 的 死亡 率 基 本 相当 且 
都 达到 最 大 .于 是 就 有 问题 :1625 年 黑 死 病 琵 亡 率 比 1603 年 计算 
出 的 降低 :是 真 的 表示 当时 黑 歼 病死 亡 率 确实 降 改 了 ,还 是 数据 有 
问题 . 他 注意 到 在 1625 年 前 后 没有 黑 死 病 的 年 份 :死亡 总 数 在 
7 000 一 8 000 之 则 ,而 1625 年 非 黑 死 病 人 人 数 则 达到 (18625 年 死亡 
总 数 为 54 265 大 ) 
54 265 一 35 417=18 848. 

比邻 近年 份 案 出 约 11 000 人 -这 显然 不 台 理 ,表明 1625 年 黑 死 病 
死 天 统计 过 低 ,原因 多 是 由 于 死者 家 属 行贿 ,让 执事 者 把 本 系 因 黑 
死 病员 疡 的 大 . 改 为 其 他 原因 . 这 种 情况 按 上 述 计算 芍 有 11 000 
.大 把 这 数 如 人 1625 年 统计 的 黑 死 病死 立 人 数 35 417, 得 


46 417, 从 而 该 年 黑 死 病死 亡 率 为 他 js 83 7%, 与 1603 年 的 


82 加 相当 . 这 证 明了 上 述 校正 的 全 理性 .考虑 到 直到 如 今 “ 数 据 的 
可 信和 竹 仍 是 困扰 统计 工作 者 的 一 个 首要 问题 , 格 裔 特 这 一 提 法 的 
饥 章 和 局 发 性 是 重大 的 , 虽 则 他 的 具体 处 理 方 法 不 一 定 能 平行 移 
植 于 其 他 问题 . 

3- 统 讨 比率 的 稳定 性 概念 , 指 基 种 特性 出 现 的 频率 , 随 着 观察 
次 数 { 样 本 量 ; 的 增加 而 趋 于 稳定 . 格 毅 特 在 韦 中 并 未 用 明确 的 语 
言 抒 这 作为 一 个 一 般 原 则 提出 来 ,但 信和 通过 对 数据 的 具体 处 理 , 显 
孙 了 他 了 的 统计 分 析 是 基于 这 样 一 个 原则 . 

他 处 理 的 一 个 具体 问题 是 伦敦 和 罗 枕 赛 (Romsey) 两 地 男 、 女 
击 生 (洗礼 } 和 死亡 数 的 统计 ,以 8 年 为 一 时 段 ,看 出 两 地 男 、 女 出 
生 比 率 趋 于 稳定 且 略 有 差 晃 . 他 贝 此 推断 ,在 伦敦 , 男 、 妆 出 生 率 之 
洲 为 14 :13, 而 在 罗 姆 塞 为 16 : 15. 这 在 历史 上 是 首次 通过 具 栖 
次 料 证 明 男 、 女 出 生 率 巾 有 差异 . 他 在 自己 的 著作 中 也 讨论 了 这 个 
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现象 的 解释 问题 . 

这 个 原则 在 早期 的 统计 学 中 曾 赵 过 重要 的 作用 ,主要 是 在 有 
关 大 号 的 统计 和 问题 中 ,在 今日 我 们 会 把 它 放 在 二 项 分 布 ( 伯 努 利 模 
型 ) 框 架 下 去 处 理 . 信和 努 利 的 大 数 律 出 于 想 在 数学 上 证 明 这 一 原 
出, 但 格 朗 特 的 工作 是 在 位 努 利 著作 出 现 前 50 年 . 

4. 生命 表 . 生命 表 是 指 现存 人 口 的 年 龄 分 布 .这 有 多 方面 的 用 
途 .例如 可 计算 处 在 某 一 年 龄 间隔 内 的 人 人 数 的 百分比 ,可 计算 一 个 
活 到 某 一 年 龄 a 的 人 中 .至少 再 活 避 年 的 百分比 ,而 这 对 于 保险 
金 . 年 金 等 的 计算 有 直接 的 关系 . 格 朗 特 在 本 书 中 首次 提出 了 生命 
表 的 概念 . 并 计算 了 现 已 知 的 第 一 个 生 俞 表 . 虽 则 他 的 推理 粗糙 其 
人 至 有 一 些 想 当然 的 成 分 ,但 仅 是 引进 这 个 概念 ,就 已 对 后 所 有 了 很 
大 的 影响 . 

因为 死亡 会 报 中 未 记录 死者 的 年 醉 , 格 斋 特 在 从 这 性 事 时 缺 玛 
精确 的 资料 可 赁 . 他 统计 了 20 年 肉 鲍 各 种 原因 死亡 的 总 人 数 为 
229 250 人 .他 认为 有 上 几 种 病 , 如 惊 风 症 . 何 伏 症 .寄生 虫 病 之 类 , 串 
者 基本 上 都 是 6 岁 届 下 的 儿童 ,这 样 的 死者 有 71 124 大. 另 有 几 种 
顷 ,如 天 花 、 腑 疹 之 类 ,患者 中 约 有 50 中 6 肉 以 下 . 这 两 项 共计 有 
?1 124 十 6 105 二 77 229 人 . 又 在 总 死亡 数 229 250 中 , 约 有 16 000 大 
死 于 黑 死 病 . 他 认为 这 事 属 非常 ,不 应 计 大 死亡 数 内 . 经 过 这 样 的 和 推 
测 或 想像 ,他 算出 一 个 人 的 寿命 不 起 过 6 岁 的 机 会 县 


fi 229 
(229 zo50—168 000) 


对 寿命 大 的 一 头 , 他 经 过 一 些 假 设 性 的 操作 ,估计 有 3 昕 的 大 活 到 
66,1% 的 人 人 活 到 76. 在 6 一 66 这 个 年 龄 段 内 ,他 采取 了 一 种 此 处 
不 细 加 解 妓 的 .奇特 的 内 插 方式 ,作出 了 一 张 表 . 该 表 对 岁数 在 
0 一 6.6 一 16、16 一 26、 ,66~76 及 76 一 80 各 段 列 出 其 死亡 率 . 从 
以 上 的 摘 述 看 出 ,产生 此 表 的 根据 甚 为 勉强 ,也 确 与 以 后 根据 更 细 
竺 资料 算出 的 表 有 较 大 的 莽 距 ,但 重要 的 是 提出 了 生命 琢 这 个 开 
蚀 狂 的 概念 .事实 上 ,他 在 这 方面 的 工作 很 快 受到 喜 更 斯 兄弟 和 和 尼 
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笠 拉 斯 ， 伯 努 利 等 概率 学 者 的 注意 ,他 们 用 福 率 论 的 福 念 和 方法 
对 它 进 行 了 分 析 . 较 晚 一 些 , 犹 葛 弗 对 之 作 了 更 深入 的 研究 ,他 于 
1725 年 发 表 的 4 生命 与 年 金 y 的 鞭 作 ,对 现时 遇 人 所 谓 “ 精 算术 "的 
那些 内 容 , 作 了 比较 全 面 和 系统 的 论述 . 


S$ 6.2 佩带 和 他 的 “政治 算术 ” 


格 朗 特 的 工作 ,在 欧洲 大 陆 也 很 有 影响 ,如 巴黎 在 1667 年 开 
如 发 表 类 似 于 伦 莪 死 六 公报 的 材料 . 这 方面 的 活动 促成 了 在 一 些 
主要 国家 中 建立 政府 统计 部 门 . 特别 是 ,他 的 工作 影响 了 抉 蒂 , 导 
至 他 建立 其 "政治 算术 ”, 即 将 统计 方法 应 用 于 广泛 的 社会 ,经济 问 
是 的 分 析 , 而 不是 其 局 限于 人 口 统计 的 问题 . 

威 厢 "企划 (Wiiliam Petty,1623 一 1687) 是 1? 世纪 英国 政治 
经 济 学 寰 . 有 的 洪 作 称 他 是 亚当 * 斯 密 之 前 英国 影响 最 天 的 经 济 
芋 家 .他 的 一 生 经 历 复杂 多 样 . 他 1623 年 生 于 英国 汉 普 郡 的 一 个 
小 镇 风 紧 塞 , 父 亲 是 裁缝 . 早年 学 习 过 数学 .希腊 交 和 拉丁 文 ,接着 
去 法 国学 习 数 学 ,天 文秀 航 海 ,后 在 皇家 海军 中 服役 , 广 到 巴黎 和 
阿 风 斯 特 丹 学 习 医 学 . 他 的 后 半生 天 半 是 在 爱尔兰 度 过 的 ,在 那里 - 
主持 过 土地 丈量 的 工作 ,并 与 爱尔兰 的 一 些 政治 和 经 济 问 题 有 过 
关联 .他 的 关于 政治 算术 的 思想 大 概 就 是 在 这 个 时 期 建立 起 来 的 
一 一 顺便 说 一 句 ,会 蓄 还 是 英国 皇家 学 会 的 发 起 人 之 一 . 

所 人 谓 政 治 算 术 , 就 是 依据 统计 数字 来 分 析 政 治 . 经济 和 社会 问 
题 ,而 不 只 是 依 车 思辩 或 理论 的 推演 . 看 一 件 事 { 比 如 一 项 政策 ) 办 
得 如 何 , 单 车 口 舌 办 论 不 行 ,要 看 有 关 统 计数 字 所 显示 的 效果 . 侯 带 
昌 称 他 的 方法 “很 不 寻常 ”: 不 依靠 抽象 的 话语 和 看 似 灵 巧 的 推理 ， 
一 切 让 数字 说 话 . 看 来 他 的 思想 受到 英国 融 大 的 科学 一 哲学 家 培根 
(Francis Bacon:1561 一 1626) 很 大 的 影响 . 培根 的 实证 科学 转 想 ， 
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即 主张 科学 理论 应 以 实际 观察 为 依据 并 接受 其 检验 . 媚 蒂 的 政 沿 自 
术 可 以 解释 为 把 这 种 思想 用 到 社会 科学 特别 是 经 济 学 中 ， 

癸 蓄 关于 政治 算术 的 代表 堵 作 是 写成 于 1676 年 ,但 到 他 去 世 
后 的 1690 年 才 出 版 的 4 政治 算术 》 一 书 . 上 面 提 到 他 目 称 其 方法 “很 
不 寻常 "的 那个 意思 ,就 配 在 此 书 的 序言 内 - 从 他 这 个 得 法 我 们 可 以 
想见 ,在 当时 .统计 方法 为 社会 以 至 学 术 界 上 所 了 解 和 理解 的 程 魔 还 
很 低 . 说 到 ¢ 政 治 算术 } 这 部 着 作 本 喘 , 其 对 县 体 的 统计 方法 的 贡献 
其 为 有 限 . 他 的 轧 想 不 像 社 并 特 那 么 周密 ,经 带 从 少量 数据 引出 大 
量 的 结论 . 他 志 不 像 格 山特 那样 用 批 兰 的 眼光 审视 数据 . 总 的 说 ,他 
的 贡献 在 于 提出 了 这 样 一 种 思想 , 即 有 关 经 济 以 至 社会 .政治 等 方 
面 的 问题 ,应 通过 分 析 由 调查 所 得 的 数据 资料 的 基础 上 去 解决 . 可 
以 这 ,他 开拓 了 统计 方法 的 应 用 面 , 即 不 局 限于 与 人 人 口 有 关 的 间 题 . 
从 统计 方法 的 技术 性 层面 上 看 ,其 贡献 是 比较 有 限 的 . 

谈 到 早期 统计 学 在 社会 方面 的 应 用 ,人口 问题 是 一 个 主要 的 
角色 - 早年 人 人们 关心 的 一 个 重大 问题 是 生男 生 女 的 比 俩 问题 ,这 个 
问题 在 概率 上 只 涉及 二 项 分 布 模型 .到 18 世纪 ,对 这 个 模型 概率 
学 痢 已 有 了 比较 深 人 的 研究 ,因而 其 用 于 统计 分 析 上 ,就 带 有 若干 
现代 统计 推断 的 色彩 .下文 要 介绍 有 关 阿 市 兹 诺 特 等 学 者 有 关 的 
工作 . 可 以 看 出 ,在 这 些 工作 中 已 包 售 了 一 些 现代 假设 检验 的 六 
于 :里 则 有 关 理 论 的 建立 还 是 二 百 余年 后 的 事情 . 顺便 提 到 , 格 户 
特 的 著作 中 也 曾 涉 及 检验 问题 ,当时 他 用 数据 验证 了 “疾病 频 发 的 
年 份 生育 率 较 低 ? 这 个 假设 . 


3 6.3 阿布 兹 诺 特 等 的 人 口 检验 工作 


阿布 兹 诺 特 (John Arbuthnott,1667 一 1735? 时 年 在 伦敦 任 数 
学 数 师 , 乌 在 1692 年 将 惠 更 斯 的 著作 《本 遇 的 理论 ? 译 成 英文 . 他 
137 


后 来 学 习 医 学 并 在 1696 年 取得 学 位 .他 的 兴趣 很 广 , 兼 有 医生 . 科 
学 家 和 作家 的 身分 . 1710 年 他 和 写 了 一 篇 论 证 神 的 意 绷 存在 的 文章 
《从 两 性 出 生 数 观察 的 规律 性 所 得 关于 神 的 意 旧 存在 的 一 个 论 
据 》, 发 表 于 1712 年 . 按 现 代 统 计 的 说 法 ,他 讨论 的 其 实 是 一 个 二 


项 分 布 概率 p 一 到 的 假设 检验 问题 (或 说 成 是 一 个 符号 检验 也 可 


以 ). 假设 检验 是 根据 观察 或 试验 所 得 数据 ,去 对 某 一 理论 或 学 说 
是 百 可 以 接 党 作出 判断 , 它 是 现代 数理 统计 学 的 主要 分 支 之 一 , 不 
少 闭 作 把 阿布 的 上 述 论 文 看 作 此 分 支 历 史 的 起 点 . 
阿布 依据 的 数据 是 1629 年 到 1710 年 这 82 年 期 间 ,; 人 伦敦 市 每 
年 受洗 男 . 妇 婴 的 数目 ,他 起 征 此 数 与 出 生 数 成 比例 , 例如 ,1629 
年 为 男 5 218, 女 4683,1710 年 为 男 7 640, 女 7 288 等 .他 发 现 每 
年 部 是 男 志 于吉. 从 理论 上 说 存在 两 种 可 能 性 :一 是 生男 生 妇 有 同 


等 机 会 (各 有 概率 二). 在 这 一 假设 (或 称 理论 .假说 ) 之 下 ,“ 在 任何 


指定 一 年 内 男 婴 出 生 数 多 于 一 半 ” 的 概率 不 超过 六 . 另 一 种 可 能 性 


是 “ 神 的 意 引 ”使 胃 村 出 生 的 机 会 大 于 女 婴 .阿布 这 样 推理 ; 若 按 第 
一 种 假设 , 则 连续 82 年 者 是“ 男 多 于 女 ” 的 机 会 ,将 不 超过 
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这 个 数 小 得 难以 想像 ,而 机 会 这 么 小 的 事件 ,居然 鹤 观 察 到 了 ,这 
古 不 侣 情理 的 ,以 此 否定 了 第 一 种 可 能 性 ,于 是 只 剩 下 第 二 种 可 能 
性 ,好 在 所 讨论 的 这 件 事 上 ,证 明了 神 的 意 旨 在 起 作用 . 现今 我 们 
把 这 件 捉 解释 为 ;观察 结果 以 很 强 有 力 的 根据 证 实 了 ;* 田 笛 出 生 
座 陋 于 女 婴 ”, 是 - -个 自然 规律 .但 为 何 会 出 现 这 个 情况 ,这 需要 从 
生物 学 上 寻求 根据 . 有 一 些 说 法 ,如 田 人 性 因 寿 命 比 女性 短 故 出 生 率 
要 页 一 些 以 保持 平衡 之 类 ,也 还 不 能 令 人 满意 . 因为 这 种 目的 论 的 
解释 , 仍 是 带 有 神 的 意 肯 的 色彩 . 顺便 提 到 ,这 项 工作 显示 了 统计 
方法 的 一 个 重要 特点 : 它 从 表面 的 数量 上 肯定 某 种 现象 可 能 存在 ， 
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但 其 科学 的 解释 则 是 专门 领域 的 任 委 .这 也 待 台 科 等 认识 中 ”由 表 
蔓 里 ”的 规律 . 
阿布 提出 的 问题 后 来 及 被 一 些 学 者 讨论 过 . 例如 ,荷兰 学 者 衬 
雷 维 塞 得 CW.J].'s Gravesande)1715 年 发 表 了 一 篇 讨论 这 个 问题 
的 文章 . 他 认为 ,由 于 每 年 出 生 栅 孩 总 数 不 同 , 阿 布 的 推理 有 过 于 
粗糙 的 缺点 .他 用 阿布 使 用 的 资料 ,算出 在 那 82 年 中 ,平均 每 年 出 
生 砚 孩 数 为 11 429. 他 以 这 个 平均 数 为 基准 ,把 这 82 年 中 每 年 男 、 
喜 册 生 数 抽 以 调整 .例如 ,1629 第 男 . 妇 出 生 数 和 分 别 为 5 218 和 
4 883 ,格雷 维 塞 得 将 其 分 蜀 调 整 为 
5 218 
5 218 十 和 4 683 


4 683 
:ll 429X 5 1844 683 


他 发 更 ,调整 后 82 年 中 , 男 婴 按 年 最 小 和 最 大 出 生 数 分 别 为 5 745 
和 6 128. 格 黄 维 赛 得 推理 如 下 :车 生男 生 女 有 同等 机 会 (概率 六 )， 


则 按 二 项 分 布 ,在 11 429 出 生 例 中 , 男 盟 数落 在 5745 和 6128 之 
图 的 概率 ,应 为 
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他 费 了 很 大 的 工夫 算出 rr 二 0. 29. 因 连 续 82 年 玫 出 瑰 这 个 情况 ， 
其 概率 只 有 
som LO 12 
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这 个 煞 非 前 之 小 ,足以 使 大 根 信 :生男 生 女 有 同等 机 会 ”的 假设 ， 
十 不 真实 的 . 销 后 必 推 测 木 % 作 者 的 公正: 尼 科 拉 斯 。 伯 努 利 , 也 用 
更 复 革 的 方法 讨论 了 这 个 问题 . 所 得 结论 都 是 一 样 , 邮 男 婴 出 生 率 
确 十 赂 太 于 立 婴 . 

拿 现代 数理 统计 学 的 眠 光 来 审视 上 述 诸 人 的 工作 ,可 以 说 它 
包 洛 了 今日 流行 的 狠 设 检验 理论 的 一 些 基 本 观点 . 迟 至 本 世纪 万 
1 3 


时 ;11 429 -= 一 U23, 


一 5 406., 


期 ,在 卡尔 * 皮尔 迁 和 费 歇 尔 那里 ,他 们 处 理 这 类 问题 的 做 法 , 左 
型 的 如 费 区 和 尔 的 "女士 品 茶 ? 的 试验 " ,实质 上 并 未 超出 上 述 诸 人 
的 范围 .但 还 缺少 了 大 二 重要 之 掺 . 例如 ,阿布 与 格雷 维 堵 得 及 其 
他 大 的 答 验 法 ,看 米 玫 合理 ,但 是 否 有 一 个 优 劣 比较 的 问题 ;根据 
什么 标准 比较 ,如 何 比 较 , 这 问题 到 本 世纪 二 三 十 年 代 才 由 奈 曼 和 
去 人 恨 " 交 尔 进 所 解决 ,参看 第 九 章 . 


3 6.4 购 特 奈 特 的 正 态 拟 合 


揣 特 厅 特 CA, Quetelet,1796 一 -1874) 是 19 世纪 最 有 影响 的 统 
计 学 家 之 一 .他 的 主要 贡献 ;是 倡导 并 身体 力行 将 正 态 分 布 用 于 六 
经 性 数据 的 分 析 . 他 的 这 一 努力 使 正 态 分 布 在 19 世纪 统计 应 用 中 
大 为 流行 .有 的 学 者 说 正 态 分 布 统治 了 19 迭 纪 的 统计 学 ,并 造 出 
J 玫 特 达 特 主 久 ?这 个 名 词 . 

持 特 茶 特 是 比利时 天 文学 家 . 在 其 后 半生 50 年 中 ,他 一 直 是 
比利时 科学 办 的 领袖 作物, 一生 著述 很 多 . 他 最 初 专心 于 纯 数 学 . 
1823 年 去 巴黎 ,向 当时 科学 界 的 一 些 大 人 物 学 习 天 文学 和 气 算 
学 , 问 富 江 叶 和 拉 普 拉 斯 等 天 数学 家 学 习 数 党 和 松 率 论 , 这 对 和 日 
后 在 统计 学 上 的 贡献 有 重要 的 影响 . : 

全 一 生 主 要 的 职业 ,是 担任 布鲁塞尔 皇家 天 文 台 的 天 文学 家 和 
气象 学 家 .但 他 在 国际 科学 界 的 名 声 , 则 主要 来 自 他 的 统计 学 家 和 和 
社会 学 家 的 身分 . 他 在 一 些 重 要 的 国际 性 统计 学 组 织 的 建立 中 起 了 
车 要 的 作用 ,这 也 括 伦 就 皇 家 统计 学 会 ;国际 统计 学 大 会 等 . 

月 1826 年 起 ,他 成 为 比利时 国家 统计 局 的 地 区 通信 员 . 因此 
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1 把 牛刀 tM; 和 茶 { 本 ) 洽 合 或 一 种 饮料 , 有 两 种 作法 : 先 加 持 奶 CMT), 先 加 茶 


(THA). 蘑 妆 生 疡 称 她 能 鉴别 这 二 省 . 变通 过 试验 .如 由 她 来 品尝 ,检验 种 的 说 法 是 否 实 
在 ， 
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他 早期 所 倾 的 统计 工作 ,大 部 和 人 口 调查 有 关 . 有 一 项 工作 是 将 拉 
普 拉 斯 的 方法 移 用 于 比利时 ,以 估计 该 国 的 大 口 总 数 . 
拉 普 拉 斯 的 方法 称 为 “比例 法 ”, 是 一 种 根据 局 部 地 区 调查 的 
销 果 素 估 计 人 全国 人口 的 方法 . 此 方法 在 概念 上 入 简单 所 :把 全 国人 
口 总 数 与 全 国 坟 去 一 段 时 间 内 大口 出 生 总 数 的 比值 记 鸭 x. 一 段 
时 间 内 大 口 出 生 数 &a 可 以 从 有 关 的 登记 资料 中 查 出 ,车 知道 +; 则 
人 和 总数 为 央 . 拉 普 拉 斯 方法 创新 之 处 在 于 提出 用 抽查 局 部 地 区 
的 方法 去 估计 +. 上 县 体 司法 是 在 国内 选 定 车 十 被 认为 有 代表 性 的 
地 区 .将 其 人 人 口 总 数 与 过 去 一 段 时 间 中 太 口 出 生 数 ,通过 实地 调查 
十 出 ;以 其 比 作 为 7 的 人 入 计 . 拉 普 拉 斯 提出 在 国内 选择 30 个 左右 
的 外 区, 要求 这 些 好 区 及 可 能 均匀 好 分 布 在 国内 ,以 使 结果 不 受 局 
部 地 区 的 特 弥 性 的 影 响 .他 这 和 神 作 法 现在 我 们 称 之 为 “代表 性 抽 
作 .从 这 段 史 实 看 ,有 理由 把 拉 普 拉 斯 算 作 盾 样 方法 的 创始 人 之 
一 . 伺 这 侍 工 作 在 拉 普 拉 斯 一 生 仍 多 的 工作 中 只 是 一 个 孤立 的 事 
件 ,他 设 有 进一步 发 展 或 应 用 这 一 方法 并 使 之 一 般 化 ,其 工作 也 流 
有 得 到 字 因 的 重视 . 终 19 世纪 ,扶梯 调查 的 理论 和 方法 没有 发 展 
旦 来 . 直到 1895 年 ,挪威 统计 学 家 凯 尔 把 伐 启 性 抽样 作为 一 个 一 
股 方 法 握 出 来 ,本 算 开 改 了 这 一 分 支 . 故 有 的 学 者 把 1895 年 作为 
抽样 凋 查 这 一 重要 统计 分 支 莱 生 的 年 份 ， 
企 1324 生 , 和 据 特 如 和 罕 将 拉 普 拉 斯 的 方法 用 于 待 计 低地 国家 
《机 . 比 . 卢 ) 人 日 ,但 他 是 用 的 从 法 国 数据 知 计 出 的 ~ 他 同时 用 出 
生 人 数 虽 死亡 大 数 去 知 计 >. 发 现 和 由 此 桥 得 的 总 人 口 数 有 较 天 的 
差异 , 且 - 村 实测 结果 有 较 大 的 差异 .这 样 一 个 不 理想 的 结果 ,以 及 
污 时 革 些 学 者 对 抽样 法 所 持 的 反对 立场 ,使 他 放 穿 了 用 抽样 方法 
估计 大 口 数 的 计划 而 回 到 普查 .不 过 ; 哩 则 他 在 这 一 工作 上 没有 取 
得 多 太 成 功 , 但 促使 他 注意 数据 的 厨 质 性 问题 ;而 正 访 分 布 就 是 他 
以 下 的 撒 述 在 细节 上 上 有些 简化 .更 他 细 的 描述 ,以 及 拉 普 拉 斯 将 这 个 方法 用 
开 舍 计 法 国人 口 时 的 具体 数据 ， 可 参看 汉 土 敖 等 编著 的 # 抽 样 调 查 的 理论 与 方法 》， 
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汐 和 解决 这 个 问 趣 而 引进 的 工具 . 从 这 个 角度 看 ,可 以 认为 他 这 一 眉 
工作 对 季 日 后 在 统计 学 上 的 贡献 起 了 促进 的 作用 . 

全 当时 的 一 些 反 对 抽样 调查 的 学 者 中 ,社会 学 家 并 维 但 榨 的 
意见 对 摆 特 奈 特 有 很 大 的 影响 . 开 维 伯 格 指出 ,影响 人 人 口 出 生 率 和 
死 立 率 的 因 过 很 多 ,如 大 住 在 城市 还 是 乡下 ,次 海 .平原 还 是 山区 ， 
高 温 还 是 低温 地 区 ,人口 移 密 还 是 稀 流 地 区 ,以 及 当地 文化 水 平 的 
高 低 . 职 业 的 性 质 、. 饮 食 情 襄 员 一 般 的 生活 习 屋 ,都 对 此 有 影响 . 因 
此 地 认为 ,要 把 这 些 受 到 极 大 数目 的 因素 影响 的 数据 放 在 一 起 去 
处 理 , 理 论 上 不 合理 ,也 不 可 能 得 出 有 用 的 结果 . 这 一 情况 使 人 们 
有 必要 将 区 域 分 得 极 细 ,而 这 会 政和 失 抽 查 的 好 处 ,他 的 结论 是 ;为 
得 到 关于 人 口 的 确 切 知识 , 舍 普 查 外 别 无 他 途 . 

以 今天 统计 学 的 知识 ,我 们 可 以 采用 随机 抽样 的 方法 来 解决 
开 维 伯 格 所 指出 的 转 难 .但 开 维 伯 格 等 社会 学 家 的 反对 意见 ,并 非 
仅 计 对 大 日 知 计 这 一 具体 癌 题 . 他 们 意见 的 主要 之 点 在 于 ;对 不 同 
压 (Cnon 一 homogeneousy 的 数据 进行 统计 分 析 没 有 有意 宅 ， 比方 说 ， 
把 一 个 城市 中 的 全 体 太 学 生 和 小 学 生 搁 在 一 个 总 体内 考察 身高 这 
个 指标 ,看 不 出 有 和 何 意 义 .而 与 此 类 和 似 的 情 癌 ,在 社会 问题 中 其 为 
肖 见 . 科学 实验 通过 对 条 件 的 控制 保证 数据 的 同 质 性 ,但 社会 问题 
的 数据 一 般 昌 观察 得 到 ,不 可 能 控制 且 许 多 寺 候 不 了 解 其 异 质 因 
率 . 这样 数据 的 同 质 性 往往 就 有 疑问 ,连带 其 分 析 结 果 的 解释 也 有 
了 问题 . 虽然 在 有 些 情况 下 ,有 明显 的 系统 性 因素 存在 ,这 时 数据 
可 所 此 去 分 别 收 集 , 而 使 分 析 具 有 一 定 的 意义 避 . 

于 是 社会 统计 工作 者 就 面 对 一 个 问题 : 当 他 面 对 一 批 他 对 其 
形 景 不 很 了 解 的 数据 时 ,如何 根据 数据 本 身 去 判断 其 同 质 性 . 在 此 
我 们 就 接触 到 押 特 奈 特 对 19 世纪 统计 学 的 一 项 重要 贡献 一 一 他 
提出 ;把 一 批 数 据 姑 和 否 能 充分 好 地 拟 合 一 个 正 态 分 布 , 作 为 该 楷 数 


1 例如 在 美 略 , 当 讨论 .工资 .教育 ,失业 和 犯罪 等 等 同 题 时 ,往往 把 白人 和 黑人 分 
开 分 析 ,或 朋 其 他 标准 如 年 龄 之 类 . 
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据 是 否 同 奢 的 一 个 判 据 . 

魁 特 奈 特 了 解 正 六 分 布 , 是 在 1823 年 他 访问 巴黎 期 间 . 当时 
拉 普 近 斯 已 提出 了 他 的 中 心 极限 定理 ;高 斯 的 不 态 误 差 理 论 也 已 
发 表 多 年 . 极 有 可 能 , 投 特 名 特 的 想法 与 上 述 因 素 的 且 发 有 闫 . 形 
式 睹 看 ,他 不 过 是 在 已 有 的 菇 础 上 同 前 近 出 一 步 把 高 斯 县 现 
的 测量 误差 分 布 的 规律 推广 到 其 他 数据 . 但 在 当时 ,这 也 需要 帘 禹 
一 些 观 念 上 的 障碍 ,因为 当时 大 们 普遍 认为 , 尖 用 于 误差 的 规律 未 
必 一 定 和 通用 于 其 他 的 数据 . 

为 实施 这 一 想法 ,和 钥 符 奈 特 发 明了 一 种 方法 ,以 将 一 批 数据 所 
合 于 某 一 正 态 分布. 他 的 方法 在 概念 二 是 基于 二 项 分 布 通 近 焉 态 
分 布 ( 犹 钢 上 费 定理 ) 这 个 已 知 的 事实 ,原理 上 不 复杂 但 实行 起 来 很 
烦琐 . 下 面 通过 他 在 1846 年 做 的 一 个 例子 来 说 明 他 的 艇 法 ,在 这 
个 例子 中 ,他 将 5 ?38 个 苏格兰 土 兵 的 胸 图 拟 合 于 一 个 正 态 分 布 . 


他 首先 造 一 个 二 项 分 布 BC999, 广 的 表 以 作为 正 态 分 布 的 一 


个 近 人 (999 这 个 数 已 很 大 ,应 能 充分 好 地 通 近 正 态 分 布 ). 但 概率 
C2-% 的 计算 很 麻 炳 ,他 采用 了 下 面 这 个 比较 巧 的 方法 . 记 p= 
(589 他 一 日 他 间 , 在 


999—i 
P+ bp. "十 1] " 
暂 设 piv 二 1, 由 上 式 依 次 算出 


_499 _ 
Pi 一 650 一 


Q. HIO O08, 


497 
pe! 


再 利用 2p 二 二 ,将 上 面 计算 出 的 调整 到 其 正确 值 ,结果 (部 
分 ) 列 为 下 表 ， 


pus = 0. 996 O08 Xx 


一 0 O88 QF "~" 
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cm Om i 


my 


-由己 王立 站 
. D23756 
- 23193 
he 
. D218342 


吓人 


EE: 
"| 席 


-3 
- 人 时 时 900 
- ld136 
.1471892 
-5 
. 1 95657 
: 2135479 


- 21069 
:POA 
O19d72 
， 亿 | 己 刁 44 


- D17928 
UIST 
. L5608 
- 芭 了 并 重生 人 
.OSBFr 


= 


累积 概率 
0. 236548 
. 256791 
,276185 
. 294627 


3121955 


. 333728 


导 44 生 纪 339 


$0807F9 
. 37 2052 


“和 横 的 意义 是 501 一 i, “概率 ”这 烂 标 出 p, 之 值 ,而 “累积 概 
率 “这 栏 是 不 超过 该 秩 的 概率 之 和 . 累积 概率 以 缓慢 的 速度 趋 于 
5. 鬼 特 条 等 原 表 中 算 到 秩 为 80 的 一 项 . 
利用 这 个 表 去 拟 合 苏格兰 士兵 胸 曾 数据 的 计算 列 在 下 表 中 
(胸围 以 英寸 + 为 单位 ,频率 以 10- 为 单位 ); 


(1) (2) [ {3} 0) (5Y (GY (7Y (BY 
| ee 
33 | 3 5 0 S000 0, 5000 7 
31 18 31 | 0.4995 592 -0.5 | 0.4993 29 
35 81 141 1 0, 4964 42. 5 .5 | 0 4964 110 
36 ,| 185 | 322 | 0, 4823 33.5 .5 | .454 323 
37 | 420 732 | 0. 4501 28 .5 | 0,4531 732 
38 ] 749 ] 305 0. 3769 18 ,5 0. 37990 1333 
39 1075 | 1867 | 0.2464 10.5 .5 | 0.2466 1838 
0 0597 2, 5 .5 |,0.0628 
:站 1079 | 1882 | 0.1285 5.5 .5 | 0.1359 1987 
11 934 | 1628 | 0. 2913 13 .5 | 0.3034 18675 
42 858 | 1148 | D 4061 21 .5 | 0.4130 1098 
43 | $70 645 | 0,4706 $0 .5 | 0.4690 560 
44 | 2 160 | 0.,4866 433 .5 | 0.4911 221 
45 |! 5D 87 | 0.4953 生 ] -5 | 0.4980 69 
16 ] 21 38 | 0 4991 | 49.5 .5 | 0 d996 16 
47 | | 7 | 0,4998 5 .5 | 0.4999 3 
i8 | 1 2 | 0.,5000 0. S000 1 
了 3 


0 避 来 使用 的 一 种 计量 单位 , 现 已 不 用 ,1 英寸 一 2. 54 厘米 , 后 同 . 
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表 的 第 1.2 列 是 各 胸围 及 其 祖 应 的 人 数 , 第 3 列 是 各 胸围 人 
数 在 总 人 人 人数 中 的 比率 . 如 胸围 为 35 英寸 的 有 81 人, 占 全 部 人 数 
5 738 的 1.41 站 .第 4 列 汶 累 积 频 率 , 由 当中 往 表 的 上 .下 两 山 登 如 
“此 国正 态 分 布 关 于 其 中 心 点 对 称 , 了 两 边 各 有 50 疡 的 概率}. 为 使 
上 、 下 端 各 占 一 半 的 颇 率 ,经 检查 ,需要 把 欧 辆 46 的 频率 D. 188 2 
分 成 两 部 分 ,一 部 分 0. 059 7 算 人 表 的 上 部 , 另 一 部 分 0. 128 5 算 人 
表 的 下 部 .这 样 ,胸围 39 一 栏 累计 频率 为 0.059 7 十 0.186 7 一 
0. 246 4, 胸围 38 一 栏 标 计 频 率 为 0.246 4 十 0.130 5 一 0. 376 9 ,等 
等 .下 部 累计 频率 的 计算 相似 . 

第 5 列 “ 秩 "一 栏 , 是 把 第 4 列 中 的 票 积 频率 与 前 面 等 出 的 二 
项 分 布 表 对 比 得 到 ,必要 时 作 插 值 . 如 胸围 38 一 栏 ,累积 频率 
0.376 9 ,与 二 项 表 中 秩 18 的 农 积 概率 0. 372 652 接 近 , 故 了 可 18 作 
为 " 脱 围 38 一 栏 的 秩 . 胸围 39 一 栏 的 累积 频率 0. 246 4 在 二 项 表 
中 , 介 二 秩 10 与 秩 11 相应 的 概率 之 间 , 故 取 其 秩 为 10. 5, 等 等 ， 

下 面 有 一 段 推理 :如 果 数 据 严 格 符合 一 个 正和 态 分 布 , 则 各 胸围 
祖 度 的 概率 ,应 接近 二 项 分 布 所 得 .因为 胸围 33,34,，…'…- 等 取 的 
等 距离 ,累积 频率 既然 接近 于 二 项 分 布 的 累积 概率 , 故 其 相应 的 秩 
记 应 大 至 保持 等 更 离 .这 一 点 可 以 作为 数据 是 否 与 正六 符合 的 一 
个 初步 检查 . 按 此 处所 得 的 具体 秩 , 往 上 .下 两 端 , 秩 的 差 店 依次 为 

10.5 -2.5 一 3，18 一 10.5 一 7.5,26 一 18 一 8 ,33.5 一 26 一 7.5， 

42. 5 一 33.5 一 89,52 一 42.5 一 9.5， 

13 一 5.5 一 7.5，21 一 13 一 8&， 30 一 21 一 0935 一 30 一 5。 

41 一 35 一 6， 49.5 一 4 一 8.5,56 一 49.5 一 上. 5。 
它 大 致 接近 等 距 8, 但 有 一 些 差 距 . 因 些 祝 步 可 以 兰 断 ,这 指数 据 
习 正 态 符 全 尚好 ,但 仍 有 一 些 偏 次 . 取 8 作为 秩 差 距 将 秩 调整 ,得 
第 6 列 的 “调整 秩 “. 然后 据 此 调整 秩 , 在 二 项 分 布 表 中 查 得 其 累积 
概率 ( 必 雪 时 用 插入 ) ,得 第 ?7 行 . 例如 , 秩 13.5 在 13 与 34 之 间 ， 
一 项 表 中 这 两 个 秩 对 应 的 累积 概率 分 别 为 0.294 627 与 
0.312 155, 故 取 此 二 值 的 平均 0. 303 4 作为 这 个 秩 (13.5) 的 累积 

145 


概率 . 由 此 就 可 算出 最 后 一 列 , 出 各 胸围 相应 的 概率 . 这 后 面 这 几 
步 ( 宸 的 6.7、.8 列 ) 实 际 上 就 是 拿 一 个 二 项 分 布 去 氢 合 表 中 的 数 
据 . 拟 合 的 程度 如 何 , 对 比 表 的 第 3.8 列 , 因 为 当 数 据 罕 合 正 态 时 ， 
此 二 列 应 一 性. 其 差距 的 大 小 ,反映 出 数据 与 正 态 偏离 的 程度 , 对 
比 二 者 看 出 ,符合 的 程度 还 比较 可 以 . 

今天 如 果 我 们 来 处 理 这 指数 据 ,将 不 会 采取 如 此 迁 回 笔 重 的 
办 法 .我 们 会 按 涪 拟 合 优 度 检 验 的 作法 , 先 由 原始 数据 算出 样本 
均值 + 各 样本 标准 差 ,加 出 正 态 密度 有 曲线 wwtzrvs) 再 必 原 数据 
的 直方 图 ( 按 表 上 的 方式 取 区 间 : 以 33,34,… 为 中 点 ,区 闻 长 为 1 
时 ). 从 直方 图 与 曲 维 N(x,s) 接 近 的 程度 ,可 以 更 清楚 和 昌 看 出 所 合 
程度 如 何 . 若 要 作 检 验 , 就 算出 六 秆 , 按 自 由 度 16 一 1 一 2 二 13 去 
检验 (16 是 区 间 数 ). 这 个 例子 反 上 出 ,在 当时 (1846 年 ), 大 们 对 正 
态 分 布 的 了 解 还 甚 有 限 [ 例 如 ,可 能 村 清楚 从 数据 去 估计 和 (Po 
中 的 = 的 方法 ], 故 只 有 从 那个 比较 熟悉 的 用 二 项 分布 通 近 的 
做 法 . | 

购 特 荣 特 用 这 个 方法 处 理 过 许多 具 性 数据 ,多 数 都 有 较 好 的 
拟 合 . 这 种 情 竟 使 这 个 方法 变 得 不 灵 玖 -一 -不 仅 局 质 的 数据 可 以 
拟 合 正 态 分 布 , 不 少 不 同 质 的 数据 也 可 以 . 现在 我 们 容易 明白 问题 
之 所 在 :许多 各 自 为 同 质 的 正 态 分 布 总 体 ,至 过 适当 混合 后 仍 可 得 
出 正 态 总 伍 . 在 数学 上 说 ;比如 有 一 群 人 依赖 参数 :的 总 体 
和 fo0) ,对 每 个 固定 的 1, 总 体 4 有 正 态 审 度 Fr 一 at 
一 上 Bab 为 沉 数 , 而 : 本身 有 正 态 密度 g(f); 则 滋 合 总 体 U,A, 有 


正 态 密度 (x) = | fc 一 at 一 g(t) dt. 另外, 当 数 据 量 不 是 


很 大 时 ,其 与 正 态 的 偏离 不 易 显 示 出 来 .用 现代 假设 检验 的 语言 
说 ,结果 常常 是 “没有 足够 证 据 显 示 数 据 与 正 态 有 显著 的 偏 商 ” 

从 届 一 面 看 ,即使 网 特 京 特 的 想法 取得 充分 的 成 功 , 仍 雹 法 解 
决 在 社会 领域 内 应 用 统计 方法 的 困难 . 开 维 伯 格 的 意见 是 总 体 应 
细作 到 同 奈 ,但 有 的 学 者 指出 :对 总 体 的 过 分 细 分 将 使 分 析 的 结论 
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受到 极 太 的 约束 而 缩小 其 意义 . 尤其 是 ,未 经 周到 考虑 和 缺乏 实际 
理由 的 织 分 可 能 导致 结论 的 任意 性 ,而 成 为 * 伪 科学 ”. 科 洛 特 蚌 这 
种 意见 的 一 个 代表 信物 . 考虑 到 他 是 一 个 类 成 将 概 雍 方 法 用 于 社 
会 问题 的 学 者 ,其 意见 值得 重视 ,可 以 举 一 个 例子 来 说 明 : 在 特定 
的 人 群 中 : 勇 女 色 膏 的 比 雍 是 否 有 差异 ?这 公认 是 一 个 有 意义 的 问 
题 . 但 还 可 以 纲 分 . 例如 ,可 以 问 ; 在 该 人 人群 所 外 的 特定 地 域 ( 如 一 
国内 荣 省 ) 这 上 比率 是 否 有 差异 ?在 婚 生 子女 和 非 婚 生子 交 间 是 理 有 
差 卉 ? 头 胎 和 二 胎 之 闻 是 香 有 差异 ? 是 期 一 出 生 的 和 星期 二 出 生 
的 十 否 有 芋 异 等 等 , 在 这 些 问题 中 ,有 的 有 合理 的 实际 意 闵 ,有 的 
则 未 必 . 比划 说 ,根据 某 一 批 玩 料 ,统计 学 家 经 分 析 可 以 得 出 结论 
说 :“ 在 双 明 出 生 的 大 中 男性 比 妆 性 更 倾 铅 于 上 患 色 育 , 单 日 则 反 
是 ， 这 类 结论 ,虽然 从 统计 分 析 上 看 似 有 根据 ,也 许 不 过 只 是 一 种 
数字 游戏 . 1980 年 美国 统计 学 家 基 弗 来 我 国 讲学 时 , 曾 提 到 社会 
上 月 些 人 对 统计 方法 有 怀疑 ,说 是 用 统计 方法 可 以 * 证 明 ” 任 何 你 
想 证 明 的 东西 , 指 的 就 是 上 述 这 类 现象 . 自然 ,这 个 问题 不 止 弃 在 
于 统计 方法 对 社会 问题 的 应 用 .在 其 他 应 用 部 分 中 也 有 .但 由 于 社 
会 问题 的 复杂 性 及 种 种 可 以 理解 的 原因 ,这 个 问题 在 统计 学 的 社 
会 应 用 中 格外 突出 , 当 是 椒 争 的 事实 . 

开 维 们 格 和 科举 特 关注 的 方向 相反 . 二 者 结合 起 来 ,揭示 了 将 
统计 方法 用 干 社 会 问题 的 困难 所 在 , 即 如 何 类 定 所 研究 的 总 体 的 
细 分 程度 ,以便 可 以 通过 数据 资料 对 问题 进行 有 意义 的 分 析 . 这 一 
成 个 仅 在 当 于 , 基 便 在 今日 , 记 不 能 说 有 了 完满 的 解决 . 这 个 问题 
从 根本 上 说 不 是 一 个 统计 或 数学 的 问题 ,通过 分 析 数 据 ( 如 岁 特 太 
竺 的 合法 ?去 处 理 它 . 其 作用 是 有 一 定 限 度 的 . 

将 统计 方法 用 于 社会 性 问题 的 研究 在 19 直 纪 进步 有 限 ,与 统 
计 方 法 的 贫乏 有 关 . 社会 问题 大 多 数 是 多 因子 性 质 的 ,例如 在 犯罪 
问题 的 研究 中 ,涉及 到 诸如 经 济 、 文 化 .教育 .就 业 -…… 诸 多 因素 的 
相互 影响 . 而 适用 于 处 理 这 类 数据 的 统计 方法 ,如 相关 回归 分 本 、 
多 元 分 析 、 方 差分 析 、 因 子 分 析 之 类 ,都 是 20 世纪 的 产物 一 最 初 
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步 的 相关 回归 福 念 也 是 到 19 世纪 后 期 才 产 生 . 目前 ,这 些 都 已 经 
成 为 社会 统计 研究 中 的 标准 工具 . 

另 一 个 困难 , 即 非 学 术 性 的 ,基于 政治 或 伦理 道德 考虑 的 反对 
意见 ,是 将 统计 方法 用 于 社会 问题 的 研究 所 特有 的 , 较 远 的 例子 如 
法 国 数学 家 种 概率 学 家 波 峙 松 (1835 年 ) 关 于 将 概率 统 订 方 法 用 
于 法 庭审 判 问题 的 研究 , 曾 受 到 法 国 哲 学 家 康 特 和 数学 家 流 因 索 
特 的 激烈 反对 ,让 为 是 对 灵魂 的 事 污 . 近 的 如 20 世纪 四 五 十 年 代 
水 联 对 统计 方法 用 于 社会 人 经济 问题 的 批判 ,认为 是 玩弄 数字 游戏 
来 掩盖 资本 主义 的 腐朽 本 质 等 . 日 前 在 我 国 ,对 数理 统计 方法 , 例 
如 扫 样 方法 ;能 否 几 于 社会 经 济 统 计 的 问题 ,也 还 存在 着 不 同 的 
意见 . 


36.5 普 通 人 


冒 特 过 特 对 统计 学 的 舅 一 个 重要 贡献 ,是 他 在 1835 年 提出 的 
普 遂 人 (average man1) 的 概念 .这 基本 工 麻 算 作 一 个 社会 学 概念 ， 
但 其 食 勾 是 统计 性 的 .这 个 名 词 ,或 者 说 ,这 个 名 词 所 草 合 的 概念 ， 
耳 到 今日 仁 非 常 流 行 . 甚至 一 些 * 普 普通 通 的 人 "也 在 日 常生 活 中 
不 和 不 觉 地 用 芭 这 一 概念 . 

设 4 是 特定 的 一 些 人 的 群体 . 例如 4 可 以 是 一 国内 全 体 大 年 
人 人 ,全体 农民 , 侈 栖 小 学 教员 ,一 城市 内 的 全 栖 男 大 学 生 , 全 体 未 婚 
大 龄 男 青年 之 类 . 则 4 的 “普通 入 ”定义 为 这 和 样 一 个 入 ,他 在 一 切 
重要 的 指标 (身体 的 ,经 济 的 .文化 的 甚至 心理 .道德 ,政治 等 方面 ) 
上 各 具有 群体 4 中 一 切 个 体 相 应 指标 的 算术 平均 值 .例如 ,我 们 
说 , 某 城市 男 大 学 生 的 "普通 人 ”身高 1. 72 米 , 体 重 64 干 克 ,每 月 
生活 费 500 元 ,每 天 看 报纸 35 分 锅 …… 等 等 .这 种 人 在 现实 中 不 


存在 ,但 给 人 真实 的 感觉 ,因为 确 有 接近 这 种 状况 的 典型 .在 文艺 
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作品 中 描写 大 物 时 ,和 作者 的 意识 中 可 能 有 这 样 一 个 普通 人 的 存在 . 

对 每 一 个 有 社会 意义 的 群体 AA, 都 有 其 普通 人 在 .大 " 普 通信 ” 
是 一 个 大 案 族 ,其 定义 也 硝 和 虱 毗 性 , 即 壮 通 人 不 一 定 在 ”一 妇 " 指 标 
十 都 具有 群体 平均 值 ,而 林 以 只 在 茶 些 研 究 者 感 兴起 的 特定 指标 
上 .例如 当 只 注意 一 城市 的 切 架 女工 的 经 济 方面 的 状况 时 ,其 普通 
人 人 人员 要 求 在 这 央 指 标 上 大平 拘 值 ;如 平均 工资 之 类 ， 

必 生 共 特 引 进 革 通 八 的 概念 ,是 出 于 建立 ”社会 物理 学 "这样 
一 个 关 妥 的 设想 . 在 1835 年 他 出 版 了 题 为 大 下 其 天 赋 的 发 展 》 的 
马兰 ， 普 通信 的 概念 即 在 此 书 中 所 引进 ,是 书 中 的 论述 及 大 们 对 
该 书 注 意 的 焦 占 .该 书 牌 得 到 很 高 的 评 检 ,有 一 则 评论 把 该 书 的 出 
版 称 为 有 文字 的 人 类 文明 中 的 新 时 期 .不 过 , 虽 财 人 们 对 椰 攀 出 的 
这 个 概念 一 般 地 抱 着 鞠 许 的 态度 ,也 有 不 少 有 保留 的 ,特别 是 在 这 
概念 用 于 心理 ,道德 等 指标 . 

“社会 物理 学 ”, 按 岁 特 这 特 的 设想 ,是 对 支配 社会 的 规律 的 量 
化 研究 . 随 着 了 和 解 的 深入 ,这 种 规律 有 朝 -- 日 可 以 达到 像 夫 交 学 和 
条 理学 那样 精密 的 程度 . 在 发 表 这 一 著作 之 前 ,他 曾 花 了 很 多 时 间 
斌 于 社会 现象 之 间 羡 在 的 关系 . 由 于 个 体 的 变异 很 大 ,在 考虑 单个 
人 的 基础 上 ,这 种 关系 就 不 易 揭露 出 来 ,这 也 许 是 引进 这 一 概念 的 
动力 .由 于 平 欧 值 的 稳定 性 ,它们 之 间 的 关系 也 就 具有 稳定 性 . 例 
如 ,放流 单个 的 人 ,其 收入 与 共 受 教育 时 间 的 长 短 之 间 的 关系 很 难 
说 , 正 . 反面 的 情况 都 有 . 但 在 正常 情况 下 ,在 群体 平均 中 受 教 育 的 
正面 效应 就 容易 显示 出 来 . 

社会 科学 的 性 质 与 像 天 文学 ,物理 学 这 样 的 学 科比 ,有 根本 的 
个 问 . “社会 物理 学 ”这 种 设想 . 按 其 严格 的 字面 意义 , 恶 怕 难 以 实 
现 . 不 过 , 近 许 雪 征 来 ,社会 科学 的 数量 化 趋势 确实 也 在 增加 . 有些 
社会 科学 分 支 ,特别 是 经 济 学 、 人 号 学 . 甚至 用 到 很 深 的 数学 工具 . 
这 也 不 妨 看 作 是 射 特 这 特 设 想 的 部 分 实现 吧 ， 
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8$ 6.6 抽样 调查 


捆 样 谢 查 主要 用 于 杜 会 统计 问题 . 国 此 ,把 与 这 个 题目 有 关 的 
历史 梗概 率 到 本 章 介 绍 一 下 . 

抽样 调查 是 横 对 于 普查 而 言 的 , 意 请 从 研究 涉及 的 总 体 中 , 按 
一 定 的 方式 抽出 一 部 分 个 体 , 对 这 一 部 分 个 体 的 有 关 指 标 逐 个 进 
行 调 查 , 以 其 结果 来 推断 整个 总 体 的 状况 . 俩 如 ,如今 常 就 茶 一 特 
定 问 题 进行 民意 测验 , 即 是 从 公众 中 接 某 种 方法 选 定 若干 人 通常 
只 占有 关 人 信众 的 一 个 很 小 的 比率 ) 作 调查 ,以 其 结果 来 判 贱 ,例如 ， 
某 项 政策 在 公众 中 的 支持 率 如 何 . 

1802 年 , 拉 和 普 拉 斯 受 法 国政 府 的 委托 ,用 其 “比例 法 ”, 通 过 机 
样 对 法 国人 口 总 数 进 行 估计 .1861 年 ,英国 的 法 尔 博 -十 作 计 人 人 人口 
抽样 调查 ,他 当时 取 了 14 个 地 区 ,包含 人 口 264,327 人 ,调查 的 指 
慰 是 家 艇 数 和 每 家 庭 的 人 口 数 等 .除了 这 些 孤 立 的 事例 外 ,直到 
19 座 纪 未 挪威 统计 学 家 凯 尔 的 工作 之 前 ;抽样 调查 不 论 在 实践 上 
条 方法 赋 究 了 上 ,都 很 少 有 开展 ， 

纪 尔 tA. NN. Kiaer) 生 于 1838 年 , 当 挪 威 统计 局 成 为 一 个 负责 
收集 和 解释 有 关 社 会 各 人 口 的 资料 的 独立 机 构 时 ,他 成 为 该 局 的 
局 长 . 在 这 个 职位 上 ;他 在 19 世纪 最 后 20 余年 中 领导 了 关于 全 国 
人 大口 和 农业 的 普查 工作 . 在 这 上 段 期 间 中 他 发 展 了 他 的 “代表 性 抽 
样 ” 的 思想 ， 

所 偶 代表 性 抽样 ,是 指 从 总 体 中 抽出 的 一 组 可 代表 该 总 体 ( 在 
选 定 的 指标 上 ) 的 样本 ,是 一 个 “小 型 化 ”了 的 总 体 . 例如 ,一 社区 中 
的 届 民 按 经 济 状 业 可 分 为 3 类 :富裕 的 100 人 人 ,一 船 的 1 000 人 ， 
较 着 的 500 人 . 现 自 其 中 分 别 抽 出 5.50 和 和 25 人, 则 这 由 80 人 组 


和 成 的 样本 是 一 个 代表 性 样本 ,通过 对 他 们 的 调查 资料 的 分 析 ,可 以 
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对 全 社区 居民 的 经 济 状 滴 作 出 一 些 推 断 , 其 准确 度 视 样本 的 代表 
性 而 定 . 

向 题 在 于 怎样 去 获得 这 种 样本 . 凯 尔 的 做 法 是 :把 人 群 中 按 地 
理 , 社 会 和 经 济 等 条 人 忻 分 成 一 些 “ 层 ”, 按 各 层 的 大 小 依 比例 抽 陪 若 
十 样本 .例如 在 1894 年 ,他 在 氛 感 进行 了 一 次 关于 退休 人 金 和 疾病 
保险 金 的 调查 . 当时 挪威 城 . 多 人 口 之 比 约 为 1 : 3, 故 在 这 一 扶 样 
中 ,上 丰 城 市 抽 2 万 人 人 而 从 乡村 抽 8 万 人 .城市 这 2 万 人 人 按 某 种 复杂 
的 方式 分 配 下 去 . 首先 ,有 13 个 城镇 被 挑 出 ,包括 当时 全 部 5 个 人 
口福 2 万 以 上 的 城市 ,所 挑 册 的 城镇 数 约 占 氛 威 当 时 全 部 城镇 数 


的 二 ,在 被 挑 出 的 每 个 城镇 中 按 经 济 状况 分 层 . 如 在 某 一 城市 中 当 


时 有 400 条 街道 ,其 中 居民 在 100 以 下 的 有 100 条 ,在 101 一 500 
之 间 的 有 187 条 ,等 等 .- 八 口 少 的 街 一 般 为 官 裕 阶层 所 住 , 因 导 这 
可 以 作为 一 个 分 层 的 标准 . 凯 尔 的 做 法 是 :居民 少 于 100 的 那 100 


条 街 全 部 取出 来 ,每 条 街 上 抽取 区 的 人 - 居民 在 101~500 的 那 
187 条 街 只 取 站 ,但 每 条 衔 上 抽出 一 半 的 住户 ,等 等 ,使 各 层 被 抽 


人 数 大 致 保持 起 的 比例 .在 乡村 ,出 主 要 是 按 居民 所 有 从事 的 职业 


夸 尔 在 1895 年 以 前 做 了 一 些 与 此 类 似 的 代表 性 抽样 调查 工 
作 . 在 这 个 基础 上 ,他 于 1895 年 召开 的 国际 统计 学 会 的 大 会 土 正 
式 扒 出 了 他 的 这 个 主张 ,引起 了 很 大 的 争议 . 但 到 1903 年 国际 统 
计 条 会 开会 时 ,他 的 主张 已 得 到 了 多 数 的 认同 ,为 研究 这 个 问题 的 
委员 会 也 在 一 定 的 保留 之 下 接受 了 这 个 主张 . 

融和 尔 的 理论 包含 两 个 要 点 :第 一 是 样本 必须 是 有 代表 性 的 . 第 


全 对 个 体 为 人 粹 外 的 情况 ,原则 没有 不 同 . 侧 如 自 全 加 小 企业 中 岳 双 代表 性 样 
本 ， 
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二 是 ,在 这 一 前 提 下 ,并 不 需要 特别 太 的 样本 量 , 就 可 以 得 旬 总 体 
指标 的 满意 的 估计 .这 后 一 点 在 当时 有 很 大 的 意义 ;因为 直观 上 党 
得 ,基于 为 数 不 案 的 样本 的 结论 是 可 疑 的 ,而 样本 量 邵 很 大， 如 上 上 
代表 性 的 要求 ,其 工作 量 丰 见得 比 普 查 节 省 多少 .但 是 ; 凯 尔 未 能 
提出 令 大 信服 的 理论 ,人 的 上 述 看 法 是 根据 经 验 而 非 理 论 的 证 明 . 
统计 学 家 流 特 凯 维 奇 就 曾 提 出 对 代表 性 样 奎 的 分 析 结 果 的 可 能 误 
差 及 厅 惊 程度 的 问题 .因此 , 虽 有 国际 统计 学 会 1903 平 的 次 定 , 则 
尔 的 主张 一 一 用 代表 性 调查 代 苦 普查 一 一 仍 椒 能 说 已 在 实 幅 中 站 
稳 脚 根 . 

下 一 个 对 抽样 调查 方法 作出 重大 贡献 的 是 饮 莱 (A.1.. Bow- 
ley). 他 的 想法 是 把 概 认 方法 引进 到 抽样 调查 中 来 ,而 这 意 昧 荐 采 
用 随机 抽 祥 方法 .他 是 在 1906 年 英国 科学 促进 协会 经 济 科 学 和 统 


计 学 组 会 议 上 的 主席 致辞 中 发 表 他 的 主张 的 . 他 指出 , 近 二 世纪 以 


来 卡尔 。 反 尔 训 和 埃 其 浑 斯 的 统计 理论 有 了 很 大 的 发 展 ,但 将 其 
用 于 实际 统计 资料 5 指 抽 样 调 查 数据 ) 则 不 多 ,现在 到 了 将 这 些 方 
法 用 于 现 有 的 工业 统计 资料 的 分 析 和 赁 兰 的 时 候 . 他 作出 这 种 论 
断 是 基于 他 对 随机 翌 本 的 研究 ,证 明了 中 心 极限 定理 对 这 种 样本 
逅 用, 有明 估 计 误 差 与 抽取 的 样本 个 数 无 关 +. 他 的 理论 验证 了 抽样 
方法 的 合法 性 ,有 使 我 们 对 通过 样本 去 估计 总 体 特征 的 精度 可 以 
了 解 . 鲍 汪 指出 ,这 一 切 的 前 提 是 样本 的 随机 性 :" 群 体 中 每 个 个 体 
有 同等 的 机 会 被 抽出 , 且 这 个 概率 与 个 体 指标 值 的 大 小 绝对 无 

鲍 菜 以 其 “新 的 有 力 的 研究 工具 ", 宣 告 “普查 并 非 必要 ”, 有 是 
“一 个 其 量 很 小 的 样本 已 足够 实现 调查 的 目的 ” 在 此 前 的 几 年 中 ， 
邮 泵 兽 以 其 雄 因 大 为 推销 这 种 主张 而 效果 不 如 鲍 莱 ,原因 是 凯 尔 
的 主张 主要 基于 经 验 和 勇气 ,而 饮 莱 则 是 基于 可 信 的 理论 . 在 以 后 


| 六 略 说 ,这 是 在 总 体 所 仿 个 体 数 N 及 图 本 量 ”都 很 大 ,用 二 不 太 搂 近 1 时. 
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的 20 年 中 , 鲍 莱 在 自己 身边 集合 了 一 指 人 对 英国 许多 城镇 的 社会 
和 经 济 条 件 进行 了 抽样 调查 ,特别 对 “伦敦 生 活 和 劳工 的 新 调查 ” 
这 个 项 目 作出 了 重大 的 贡献 . 与 此 同时 ,他 搂 写 专著 《抽样 调查 精 
度 的 度量 3 并 于 1926 年 出 版 . 

在 中 断 了 20 年 以 后 ,国际 统计 学 会 在 1924 年 指定 了 一 个 包 
括 饮 革 在 内 的 6 位 学 者 组 成 的 委员 会 来 研究 ” 往 计 学 中 代表 性 方 
法 人 的 应 用 ”. 该 委员 会 的 报告 于 1926 年 提交 给 在 罗马 举行 的 国 
际 统计 学 会 大 会 . 大 会 对 抽样 方法 作 了 明确 的 肯定 ,但 指出 代表 性 
抽样 方法 有 随机 抽样 和 目的 性 抽样 丙种 . 目的 性 抽样 的 意思 基本 
上 与 凯 尔 的 代表 性 损 样 相同 ,但 含有 在 保证 样本 代表 性 的 前 所 下 ， 
根据 抽样 调查 的 目的 选择 厦 本 的 意思 . 决议 中 也 指出 会 议 主张 抽 
样 应 如 此 安排 以 使 能 对 收集 的 数据 进行 数学 处 理 , 并 对 误差 大 小 
作出 估计 .决议 也 重申 以 前 的 主张 ,好 每 一 项 抽样 研究 都 应 附 有 对 
所 用 抱 样 的 方法 的 仔细 陈述 . 在 这 次 大 会 上 ,抽样 方法 的 科学 性 没 
有 像 从 前 那样 引起 争议 ,说 明 经 过 30 年 的 努力 ,这 方法 已 最 终 被 
公众 接受, 最 然 它 也 没有 完全 取代 全 面 普 查 法 . 

数理 统计 学 家 也 对 随机 抽样 法 的 确立 和 发 展 作 出 了 贡献 , 首 
先是 凌 歌 尔 . 他 自 1919 年 起 在 英国 一 个 农业 试验 站 工作 了 十 多 
年 ,从 事 农 业 试 验 及 其 统计 分 析 的 研究 工作 . 他 提出 了 用 随机 的 方 
法 分 配 刍 间 试 验 小 区 的 好 处 的 论据 ,以 及 进行 这 种 试验 设计 的 3 
原则 . 其 中 的 “划分 区 组 ”一 条 ,与 所 样 扭 音 中 的 "分 层 ”* 的 思想 一 
致 , 即 在 随机 化 的 设计 中 禹 人 系统 性 因子 的 作用 以 降低 由 随机 北 
带 来 的 误差 , 其 次 , 奈 曼 在 1934 年 发 表 论 文 ¢ 关 于 代表 性 方法 的 两 
个 不 同方 面 :分 层 抽样 和 目的 性 抽样 》. 在 此 文中 奈 曼 对 目的 性 抽 
样 从 理论 上 和 作 了 批评 ,把 与 分 层 相 结合 的 随机 抽样 建立 在 一 个 严 
格 的 理论 基础 上 ,并 发 展 了 一 种 不 恢 靠 贝 叶 斯 假设 的 居 计 方法 ,这 
是 他 发 展 一 个 全 面 的 区 间 估 计 理 论 的 重要 一 环 . 印度 著名 统计 学 


山 这 里 ， 改 胡 性 方法 "的 意思 就 是 抽样 方法 ,不 限于 原来 凯 尔 的 代表 性 调查 ， 
lo3 


深 马 喻 抄 庶 比 斯 对 抽样 方法 的 理论 和 实 不 也 作出 过 重要 的 贡献 . 

自 30 年 代 以 来 ,抽样 调查 方法 受到 包括 美国 在 内 的 一 些 国家 
的 重视 ,其 应 用 也 变 得 经 毅 . 成 后 建立 的 联合 图 ,也 于 1947 年 在 其 
统计 司 中 建立 了 一 个 抽 梓 分 委员 会 ,发 布 过 一 些 指导 性 文件 ,对 抽 
祥 调 查 方 法 在 全 球 的 应 用 和 推广 起 了 很 大 的 作用 . 
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闻 骨 小 闪 或 性 平 申 闹 呈 


第 七 章 ”回归 与 相关 : 
发 现 与 早期 发 展 


运 至 19 世纪 士 上 二 年 代 , 统 计 学 的 重心 在 欧 训 大 卡 . 当时 黄 
国 在 这 方面 多 在 落后 状态 ,是 统计 学 理论 和 方法 的 输入 国 . 例如 重 
要 的 最 小 二 乘法 产生 于 法 , 德 ,以 后 "出口" 到 英国 . 当时 欧陆 在 误 
夺 论 ,最 小 二 乘 理 论 和 线性 模型 理论 方面 已 有 了 长 足 的 进展 ,可 英 
国人 人 知之 不 多 . 有 网 统计 学 者 (如 西 尔 ) 论 证 ,即便 像 卡 乐 ， 皮 尔 提 
和 费 贺 尔 这 样 约 大 级 统计 学 家 ,对 欧陆 这 方面 的 著作 也 研读 不 能 ， 
前 这 个 情 闹 在 20 址 纪 最 初 几 十 年 统计 学 研究 工作 产生 了 影响 ( 见 
第 八 章 )， 
但 自 19 世纪 某 个 时 候 开 始 , 事 情 起 了 变化 . 转机 源 起 于 1870 
年 代 开 始 的 高 尔 登 用 统计 方法 研究 遗传 学 ,终于 导致 统计 学 上 的 
突 玻 性 进展 一 一 问 归 和 相关 的 尝 现 和 恬 展 . 在 这 项 工作 中 创新 的 
媒 想 出 身高 尔 登 ,而 使 之 完善 化 的 则 是 以 卡尔 。 皮尔 逊 为 代表 的 
一 批 学 者 . 
这 项 发 展 的 意义 和 影响 极其 重大 . 不仅 是 统计 方法 武 库 中 增 
加 了 一 个 有 用 的 品种 -一 --19 世纪 统计 学 在 社会 问题 中 的 应 用 进 
展 不 大 ,与 谈 亚 回归 相关 这 个 工具 有 关 . 因为 社会 问题 中 有 许多 不 
是 单 因素 的 ,而 是 牵涉 到 一 些 因素 的 关系 . 其 次 ,这 项 发 现 沟通 了 
原来 互 不 相干 的 两 个 领域 一 -误差 论 线性 寞 型 和 统计 学 (参看 第 
五 章 开 头 有 关 的 人 氢 述 》, 成 为 20 世纪 上 半 叶 统计 方法 重大 发 展 的 
契机 ,代表 性 成 果 是 费 欧 尔 的 方差 分 析 , 另外 ,这 一 发 展 , 由 于 其 涉 
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及 的 问题 复杂 而 儿 方 面 ,促进 了 一 个 严整 的 统计 学 框 染 的 建立 -所 
以 ,所 某 种 意义 上 可 以 说 ,这 项 发 展 标 志 了 统计 学 找 述 时 期 的 结束 
和 推断 时 期 的 开端 . 另 一 个 明显 后 果 是 :统计 学 的 重心 上 自 此 枉 步 目 
欧陆 称 向 英国 ,使 后 者 在 以 后 儿 十 年 统计 学 发 展 的 黄金 时 代 充 当 
了 火车 头 . 

本 章 的 上 县 的 就 是 讲述 这 个 发 展 的 故事 . 


3$7.1 高 尔 登 和 正 态 分 布 


弗 庄 西 斯 "高 尔 登 (Francis Galton,;1822 一 1911) 音 年 在 剑桥 
天 学 学 习 医 学 ,但 医生 的 职业 对 他 并 无 吸引 力 . 后 来 他 接受 了 一 笔 
得 产 .这 使 他 可 以 放弃 从 医 的 生 泛 ,并 于 1850 年 一 1852 年 期 间 去 
非 浏 考察 . 地 所 取得 的 成 就 使 他 在 1853 年 获得 英国 皇家 地 理学 会 
的 爹 语 奖章 . 此 后 地 研究 过 名 种 学 科 ,; 和 包括 气象 党 、 心 理学、 社会 
党、 教育 学 和 和 指纹 学 等 ,但 1865 年 后 他 的 主要 兴趣 转向 遗传 学 , 这 
也 许 与 他 的 近亲 家 兄 ,¢ 物 种 起 源 》 的 作者 达尔 文 对 地 的 影响 有 关 . 

亡 尔 登 是 一 个 “ 乱 特 这 特 主义 者 ”, 对 正 访 分 布 怀 有 特殊 的 兴 
趣 和 好奇. 有 一 说 认为 “和正 态 ”一 词 肥 出 于 他 局 .他 在 1908 年 发 表 
的 回忆录 性 Memories of My Life$) 中 说 ,他 最 初 接 角 押 特 牵 特 所 
合 正 态 山 线 的 方法 是 在 1863 年 .在 其 后 几 年 闻 ,他 使 用 各 种 数据 ， 
包括 身高 .胸围 以 至 考试 成 绩 等 ,结果 都 符合 得 很 好 . 因此 ,他 在 


这 是 统计 学 家 西 尔 在 其 4 商 斯 钱 性 寞 型 的 历史 震 展 ?一 文中 提出 的 说 法 , 但 卡 
示 ， 诺尔 于 在 # 权 尖 的 历史 注 记 # 一 交 中 说 * 率 年 前 ;我 把 拉 普 控 斯 -高 杂 曲 阑 称 为 正 想 
赐 战 ”… 提 还 说 ,这 个 称呼 虽 热 避免 了 一 个 国际 优先 权 的 当 议 ,信也 有 其 庙 点 , 助 炜 人们 
误 训 为 ,一切 其 他 的 阔 率 分 布 曲 线 , 都 是 在 这 个 惑 逆 个 意 文 上 * 非 下 带 ”, 这 已 把 导致 许 
率 作 者 把 不管 计 避 样 的 分 布 硬 扭 起 正 态 的 , 后 来 一 些 学 者 也 响 谱 这 一 意见 . 如 赔 格 林 
等 在 其 * 标 索 数 据 分 析 Y 一 书 中 宜 称 , 书 中 只 用 “高 斯 分 布 " 的 名 称 而 不 用 * 正 态 分 布 "， 
以 他 引起 误会 ， 
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1869 年 出 版 和 的 一 部 着 必 中 发 表 了 与 鬼 特 奈 特 一 样 的 观感 :与 正 访 
曲线 氢 合 得 好 是 数据 同上 夺 性 的 可 靠 标 志 . 他 还 作 了 一 总 引 俐 ,可 以 
用 一 个 例子 来 说 明 . 如 果 在 平面 上 指定 4 .局 两 个 不 辣 和 的 靶 点 ,和 殷 、 
乙 二 人 分 别 向 4. 点 多 次 射击 , 则 着 弹 点 在 面 上 会 有 两 个 集结 中 
心 而 不 表现 同 质 .但 可 以 设法 分 离 出 其 成 分 . 一 般 说 ,若干 个 局 质 
数据 的 混合 体 , 可 异 助 正 态 分 布 分 离开 Y. 

已 的 男 外 一 个 引种 就 显得 过 于 大 胆 , 但 也 生出 了 一 个 有 用 的 
概念 . 同一 个 物种 ,例如 入 ,有 很 多 指标 ,如 身高 ,体重 ,血压 …… 以 
圣 一 些 非 数量 性 的 指标 如 智 妃 .心理 素质 之 类 , 高 尔 登 认 为 ,( 鲍 
如 ) 对 一 群 人 , 知 测 得 其 一 个 指标 ,如 身高 ,可 以 用 瑞 态 曲线 很 好 地 
拟 合 , 则 其 他 指标 世 将 如 此 . 这 上 听 起 来 有 点 全 人 难以 置信 . 不 过 对 
能 间接 量度 的 数量 指标 ,这 个 推断 总 可 诉 诸 实验 . 有 意思 的 是 将 其 
用 于 非 数 量 指标 的 情形 . 商 尔 登 1875 年 引进 “统计 尺度 ”可 以 举 
一 个 例子 来 说 明 : 从 4. 吾 两 城市 各 抽取 其 商 一 学 生产 .器 名 ,要 比 
较 其 智力 水 平 ,假定 用 一 种 综合 性 的 测试 方法 ,该 法 只 判 出 两 个 学 
生 中 智力 谁 高 谁 尾 , 但 不 给 出 数量 六 小 ,上 且 方法 有 传递 性 5 即 如 该 
法 判定 甲 高 于 乙 和 乙 商 于 两 . 刚 必 判定 甲 高 于 了 辣 ). 现 用 该 法 将 全 
部 一刀 十 二 个 学 生 判 定 一 个 由 低 到 高 的 钦 序 (最 盖 考 为 1, 最 好 
普 为 N). 如 果 某 学 生 的 位 次 为 i, 则 定 其 “统计 尺度 ”为 驯 - 


| 寺 讲 了 | ,' 史 为 NC0,1) 的 分 布 函 数 . 这 样 可 算出 A 城 加 个 学 生 的 


统计 下 度 工 ,…,xs 和 加 B 城 #4 个 学 生 的 统计 尺度 yl,…,y,. 这 已 经 
数量 化 了 ,于 是 可 以 把 用 于 分 析 数 量 疯 测 值 的 统计 方法 用 上 来 . 这 
种 司法 在 一 些 诸如 心理 学 ,教育 学 之 类 的 学 科 中 很 有 追随 省 ,直到 
现在 仍 在 应 用 统计 中 有 一 定 的 地 位 . 


TL 这 性 事 说 来 容易 仇 来 蕉 , 在 两 个 正 态 滥 台 , 均 乱 有 一 定 分 次 而 前 差 不 大 的 情 
认 ， 席 全 数据 旦 明 虹 的 双 帮 ,视觉 可 以 办 别 , 但 各 成 分 的 参数 如 和 柯 并 不 好 定 . 第 五 竟 
在 分 绍 卡 尔 " 点 尔 吉 的 狂 合 正 态 委 数 估计 的 问题 时 ,已 指出 过 这 一 点 .如 果 蔽 温 合 的 
间 质 歼 据 组 较 多 , 则 混合 后 可 以 接近 正 恋 ,至 少 在 外 形 上 看 似 正 态 或 单 几 . 在 这 种 博 况 
下 ,此 说 党 上 可 能 也 乃 友 出 混合 数据 不 是 出 自 一 个 同 岳 总 址 . 
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然而 ,对 高 尔 登 而 言 ,这 个 无 所 不 在 的 正 态 性 给 他 带 来 一 些 轴 
感 . 考察 亲子 两 化 各 自 的 身高 数据 ,发 现 其 遵从 同一 的 正 态 分 
布 呆 . 按 拉 普 拉 斯 中 心 极 限定 理 , 正 态 分 布 成 立 的 条 件 是 大 量 的 但 
每 一 个 作用 较 小 的 因素 的 作用 ,而 遗传 是 一 个 显著 因素 ,这 二 者 如 
何 协 调 ? 其 次 ,遗传 把 一 种 性 状 ( 如 身高 ) 的 优势 传递 给 下 一 代 , 册 
按 常 理 扒 想 应 出 现 两 极 分 化 的 态势 . 果 如 此 ,我 们 会 看 到 一 代 一 代 
的 人 人 中, 个子 很 高 和 很 娇 的 人 的 比例 日 浙 升 高 ;而 中 和 间 部 分 的 比 倒 
日 浙 下 隆 . 但 一 代 一 代 身 高 稳定 的 正 态 分 布 与 此 相悖 . 

高 尔 登 为 解决 这 些 困 惑 致 力 了 十 余年 ,终于 取得 圆满 的 成 功 . 
在 解决 这 些 问题 的 过 程 中 他 的 基本 工具 ,是 对 由 实验 种 抽样 得 来 
的 数据 进行 统计 分 析 . 在 统计 学 中 起 了 极为 重大 作用 的 相关 回归 
方法 ,也 在 这 一 研究 中 葛 下 了 根基 .因此 ,这 一 成 就 既是 遗传 学 上 
的 重大 事件 ,也 是 统计 学 上 的 重大 贡献 ， 


$7.2 癌 归 的 发 现 


1877 年 ,高 尔 登 想 出 了 一 种 机 制 来 解释 上 面 所 提出 的 第 一 个 
由 是 考 感 在 一 大户 全 侍 不 均匀 的 邮 方 种 植 一 种 水 果 , 如 革 果 . 所 
入 条 实 的 大 小 与 果树 所 在 处 所 的 条 件 育 鞠 , 如 在 向 阳 的 处 所 优 于 
背 阴 的 外 所 之 类 . 所以， 果树 所 在 处 所 ”是 一 个 显著 因素 ,但 昌 则 
如 上 星 , 这 一 太 片 地 方 所 结果 实 全 体 的 六 小 的 分 布 , 仍 与 正 态 拟 合 得 
很 好 . 高 尔 登 对 这 一 点 起 出 了 一 种 解释 ,大 意 很 简单 ; 


Ce 


工 全 中 国 5 年 代 到 理 在 的 和 情况 看 ,平均 身高 有 较 明 显 的 上 升 趋势 ,身高 方 益 也 
应 有 所 增加 . 因此 ,这 个 "同一 正 态 ”的 顶 象 并 非 在 任何 时 息 任 何 地 方 都 有 将 . 但 存 通 常 
捕 况 下 在 一 二 代 和 中 的 变化 也 许 甚 枉 ,因而 可 认为 这 一 观察 基本 成 立 . 就 商 尔 登 为 研 
于 此 站 题 最 党 的 数据 而 育 《 见 后 广 ?这 是 成立 的 , 而 且 , 在 短期 内 这 种 变化 主要 由 于 生 
活 莹 性 的 变化 ,各 和 传 加 未 的 作用 比较 有 限 . 
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水 果 大 小 二 "处 所 " 因 到 的 必用 十 其 他 大 量 的 名 种 是 喇 不 
大 的 因素 的 作用 的 全 加 
但 "处 所 "因素 的 作 表 ,也 可 以 分 解 为 大 量 的 影 碎 不 大 的 因素 作用 
的 警 加 ,把 这 代 人 上 式 ,就 得 到 
本 宁 大 小 一天 量 影响 不 天 的 因 素 作 用 的 司 加 ， 
因 而 按 拉 普 拉 斯 中 心 极限 定理 ,水 果 天 小 的 分 布 应 能 拟 合 于 正 态 ， 

这 样 一 种 想 靶 可 以 从 实际 观察 中 得 到 印证 .如果 在 一 大 片 地 
形 和 条件 复 某 的 果园 中国 出 一 小 左 ( 因 而 入 件 比 较 均 名 ), 则 实测 表 
朋 ,这 一 小 块 地 所 产 洒 实 天 小 的 分 布 为 正 态 ,其 均 伟 与 所 圈 地 方 有 
关系 并 随 之 连续 变化 - 故 也 可 以 这 样 看 :全 部 水 果 大 小 的 分 布 , 是 
证 允 "小 正 态 分 布 " 的 混合 . 如 果 处 所 条 人 性 的 分 布 也 是 正 态 , 则 这 一 
混合 得 出 正 态 分 布 . 

为 了 形象 地 解释 这 个 说 法 , 商 尔 登 
设计 了 一 个 列 出 心 裁 的 装置 ,他称 之 为 
quincunx 我 们 站 译 为 “* 正 态 狂 斗 ” 图 
1 是 一 个 示意 图 . 预 部 为 一 漏斗 形容 
主 . 各 将 许多 大 小 一 样 的 小 球 和 全 人 布 打 
和 开 开 关 , 由 小 球 从 管道 中 逸 出 ,每 个 小 
球 首 先 碰 到 第 一 排 的 钉子 XX. 该 装置 如 
此 设计 ,使 该 球 继续 下 莫 时 , 必 于 到 第 
2 排 那 2 个 打 XX 的 箱子 之 一 且 碰 到 的 图 7. 1 


概率 都 是 六. 球 继续 下 沙 时 情况 与 上 相同 . 在 小 球 经 过 各 排 钉 于 础 
挤 后 , 落 人 底部 隔 开 的 一 些 村 内 . 按 上 述 机 制 , 若 一 共有 ， 排 钉子 ， 
则 和 名模 内 球 数 服 从 二 项 分 布 BCn, 二 ). 当 # 较 大 时 0, 它 接近 正 态 
分 布 , 如 图 扬 示 . 


六 高 水 登 首 次 在 一 个 学 术 会 这 上 出 示 *“awincunx” 是 1874 年 . 他 帮 的 quincunx 中 
很 大 而 模 的 数 岂 在 20 左右. 这 个 数目 妃 大 到 足以 显示 证 索 生 布 ， 
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到 此 为 止 , 这 个 汇 
置 只 不 过 基 一 个 生成 
二 项 分 布 及 二 项 分 布 
通 近 正 态 的 演示 髓 . 但 
高 尔 登 对 它 作 了 一 个 
和 用 ,使 之 与 我 们 眼前 
讨论 的 问题 联系 起 来 . 
他 没 想 在 此 装置 的 中 , 
间 某 处 AB 将 流下 的 " 
小 球 截 住 ; 如 小 球 将 在 
该 处 育成 一 个 近似 于 
正 态 曲线 的 形状 ,如 图 
7.2. 现 藻 把 4 二 处 的 
阀门 打开 ,证 小 球 继 续 
其 站 guincunx 中 的 行 图 7.2 
程 . 则 图 中 每 一 段 标 黑 
的 部分 可 视 为 一 个 小 球 的 源 ‘ 起 着 漏斗 中 球 的 作用 ,但 出 口 管 在 黑 
条 处 ). 源头 的 大 小 取决 于 黑 条 的 长 短 , 人 盖 近 中 部 鳄 强 . 每 一 个 这 样 
的 源 在 装置 的 底部 形成 一 个 “小 正 态 分 布 ”, 略 7.2 中 显示 了 3 个 族 
子 : 而 底部 形成 的 “大 正 态 分 布 ? 则 是 这 些小 正 态 的 混合 . 以 此 与 种 
植 水 困 的 和 情 沈 类 比 , 则 4 如 上 各 处 不 同 的 位 置 相当 于 不 同 的 种 植 处 
也, 训 4 二 整个 可 看 成 一 个 "显著 因素 ”, 底 部 形成 的 正 访 分 布 , 则 表 
明 :纵然 有 此 显著 因 球 的 作用 ,并 不 影 顺 最 终结 果 的 正 态 性 . 

次 比 到 人 的 身高 (或 其 他 性 并? 的 遗传 , 则 遗传 这 个 因素 相当 
子 水 果 种 植 中 的 姓 所 ,quincunx 中 的 48, 其 不 妨碍 下 一 代 该 性 状 
的 正 态 性 于 是 得 到 一 种 解释 . 

这 个 发 现 如 果 从 概率 论 的 层 商 上 去 看 自 展 简单 . 它 无 非 是 正 
态 变 量 简 单 性 质 的 后 果 , 仔 如 因此 而 认为 高 尔 登 这 个 发 现 平淡 无 
奇 , 那 就 大 错 了 . 其 创新 之 处 要 从 实用 的 层面 去 看 . 第 一 ,他 把 正 态 
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亚 量 的 性 不 麟 造 人 性 地 用 于 这 样 一 个 重要 现象 (遗传 ?的 解释 中 , 合 
理 地 说 明了 了 初 一 看 难于 解释 的 现象 .第 二 , 它 解 释 了 我 们 在 第 六 章 
中 讨论 押 特 奈 特 用 正 态 拟 合 作为 数据 辣 质 性 的 判 据 中 提 汉 的 一 个 
事实 . 即 为 什么 会 发 现 这 么 名 的 同 质 数据 . 商 尔 登 这 个 发 现 表 明 : 
重要 的 个 在 于 上 发现 同 质 性 .而 是 了 解 这 一 点 : 同 质 性 表 而 的 背后 妃 
富 让 许多“ 异 质 ”的 成 分 . 

噩 尔 登 解 开 前 述 的 第 2 个 困惑 的 关键 是 另 一 个 试验 . 它 使 高 
尔 登 发 现 了 亲子 代 间 性 状 遗 乱 中 ,人 性状 有 阿 中 心 回 归 的 现象 . 简 言 
之 ;高 个 子 的 后 代 平 均 说 米 也 高 些 , 但 不 如 其 亲民 那么 高 ,要 向 平 
均 身 高 的 方向 "回归 ”一 些 . 谋 破 了 .我们 也 但 平 会 觉得 这 个 更 象 是 
在 生活 中 常见 昌 属 "理所当然 "的 ,这 还 是 用 得 着 前 而 提 及 过 的 一 
人 可 老 话 : 一 个 重大 的 发 现 可 能 在 点 破 之 前 ,人 们 长 久 没 有 想到 ,而 
一 经 点 酸 , 艾 给 人 以 理所当然 之 刁 : 苹 果 从 树 上 落地 是 因为 地 球 存 
引 方 ,这 昕 汪 很 在 理 : 役 有 这 个 力 如 何 能 把 苹果 拉 到 地 而 上 来 ? 

1875 年 ,高 尔 登 约请 了 7 了 位 朋友 帮忙 ,他 精心 挑选 了 ?了 种 大 
小 不 同 的 甜 驳 豆 种 子 ,每 种 70 粒 . 他 分 给 每 位 明 友 各 7 了 xl 过 ,请 
他 们 各 自 去 种 下 . 到 1877 年 他 完成 这 试验 的 数据 分 析 后 ,有 了 重 
大 的 发 更 . 

其 一 ,高 尔 登 考察 同一 大 小 种 子 的 后 代 , 其 大 小 构成 正 坊 分 
市 . 这 一 点 在 意 中 , 不 足 为 奇 . 恒 高 尔 登 惊奇 的 是 他 发 现 , 这 分 布 的 
方 莽 村 种 子 大 小 无 关 . 他 说 ,他 为 此 感到 和 凉 奇 ,但 这 研 然 是 事实 ,他 
就 感激 地 将 其 接受 下 来 ,要 是 情况 不 如 此 ,就 难于 想像 问题 如 何 能 
在 埋 论 上 得 到 解决 {这 一 点 驱 后 文 自 明 》. 

其 一 ' 大 (小 ?种 子 产 生 的 子 代 , 其 平均 也 大 { 小 ) 一 些 , 但 有 往 
有 恒 我 中 心 (七 种 大 小 的 母 代 的 平均 ) 收 缩 的 趋势 ,县 收缩 量 呈 线 性 
此 式 . 具体 说 , 设 母 代 平 均值 为 4, 若 革 一 母 信 的 大 小 a 计 有 4, 刚 该 
母 代 所 产生 的 子 代 平均 大 小 4 也 大 于 4; 但 a' 一 A 只 有 a 一 4 的 
] 


Eh 


开心 1 


l4 15 18 17 13 19 230 3 22 


图 ?7.3 
3 是 卡尔 。 度 尔 避 就 高 尔 登 的 甜 更 豆 试 台数 据 配 的 回归 
豆 线 . 横 轴 和 坚 轴 分 别 标 示 生 代 和 子 代 豆 于 的 直径 :了 0 91 对 为 
单位 . 加 点 表示 和 母 代 种 子 直 径 取 茶 秆 于 ,其 子 代 直 径 的 于 均值 ,各 


归 线 的 斜率 ,部 回归 系数 了 , 约 为 己 . 


9uincunx 太 上 述 发 现 可 用 于 解释 举 子 代 人 分布 为 何 能 保持 粮 
定 ( 即 西 代 分 布 相 同 ) 的 机 出 . 惯 品 是 这 样 的 :guincunx 和 解释 了 汶 
何 子 柜 分 布 能 保持 正 态 . 正 态 分 布 的 对 称 性 及 子 代 条 件 均值 往 中 
心 作 线 性 收编 5 固 归 ) ,解释 了 为 什么 也 和 找 均 等 与 租 代 一 样 , 盏 于 地 
代 方 差 , 要 是 没有 回 妇 托 用 ,村 来 是 交友 于 母 代 方差 的 ,内 为 周 定 
苹 代 值 后 于 代 还 有 一 条 性 万 着 si. 如 没有 回归 ,这 个 qf 焰 是 子 民 
广 盖 友 出 母 代 方 关 的 部 分 .但 由 于 三 好 使 子 代 均值 有 了 收缩 ,这 相 
点 缩小 了 方 养 , 从 而 插 请 了 所 增长 的 部 分 oi. 

关子 "回归" 现象 的 机 制 , 局 尔 登 也 回 出 了 一 种 用 quincunx 去 
解释 的 互相 办 法 , 邑 quincunx 的 上 部 癌 中 心 颂 稀 ; 见 图 7. 4. 


i， 昌 先 业 人 尔 登 称 之 为 道 转 痕 数 tcoafficient of reversion}, 后 来 仍 改 内 里 时 对 熬 
Ceoeffirient of Fegressiony 的 名 称 !885 年 3, 
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作为 节 、 子 代 分 布 稳定 性 的 实验 解 
释 , 上 述 甜 殊 豆 试验 有 其 不 是 之 处 ,是 
因为 母 代 大 小 是 事先 选 定 而 非 自 然 产 WIW 
生 的 , 且 一 共 上 只 有 7 种 同样 的 数目 :在 
自然 状态 的 母体 中 ,各 种 大 小 的 母体 
数 , 按 正 态 分 布 , 会 有 所 不 同 ). 因此 高 
尔 登 想 要 通过 自然 采集 的 人 体 指 标 数 
据 来 进一步 验证 上 述 结论 . en 

1885 年 ,高 尔 登 以 保密 和 给 予 金钱 全 
报酬 为 许诺 ,通过 向 社会 征求 的 方式 ，- 
获得 了 205 对 夫妇 及 他 们 的 928 个 成 年 -区 
子女 的 身 商 . 因 女 子 身 毅 一般 谤 低 于 男 
子 , 商 尔 登 采用 把 女 于 身 商 溢 以 1.08 
的 方法 “折算 ?成 男子 的 身高 所 , 他 采用 
“中 亲 "? 即 父母 平均 身高 作为 母 代 变 莉 
, 子 代 变量 记 为 了 .高 尔 登 通过 数据 分 析 验 证 了 使 用 中 亲身 高 的 
合理 性 . 例如 ,配偶 身高 太 体 独立 , 子 代 身高 只 依 闵 父 母 平均 身高 
而 与 (例如 ) 父 母 身 高 差 无 关 等 . 

高 尔 登 把 和 YY 的 值 域 划 分 为 一 些 区 间 , 计 数落 在 每 一 区 间 
组 合 内 的 子 代 人 数 .如 苹 在 67.7( 寺 ) 和 68.7 之 间 ,Y 了 在 68 和 69 
之 间 的 有 34 人 . 高 示 登 对 这 样 列 出 的 数据 表 作 了 一 点 修饰 :他 把 
每 个 格子 中 的 数据 用 上 下 左右 四 个 格子 中 数据 的 和 去 取代 . 高 尔 
登 加 出 经 修 习 后 的 数据 表 上 的 等 值 线 ,发 现 它们 是 一 些 以 (68. 25， 
68. 25) 为 中 心 的 同心 同 轴 的 相似 椭圆 . 他 还 发 现 了 : 

1. 这些 本 图 的 与 横 轴 5 子 代 ?平行 的 切线 ,所 有 的 殷 点 在 一 通 
过 中 心 的 直线 上 ,此 直线 对 纵 轴 (和 母 代 ?的 斜率 ( 即 tg9,9 为 此 直线 


| | | | 
| I 


图 7. 4 


DD 高 尔 登 职 网 1. 08 是 数据 中 男女 平 均 身 高 之 比 . 正如 卡尔 :皮尔 襄 指 出 的 ,应 
当局 用 男 、 女 身高 的 标准 差 之 比 . 但 皮尔 物 艺 指 出 ， 由 于 男 、 立身 离 的 变异 系数 大 数 相 
同 ,高 外 孝 的 届 宗 水 向 要 来 区 大 问 歇 ，: a Br A i 


$3 


与 纵 轴 的 夹 角 ) 为 <， 


得 定 中 亲身 高 y 的 条 件 焉 , 子 代 身高 的 条 件 分 布 方差 与 y 污 
鞠 , 其 最 可 能 值 ( 即 众 数 ,在 假定 子 代 杀 件 分 布 为 正 态 时 , 即 条 件 均 
值 ? 为 与 袜 贺 切 点 (图 7.5 中 的 六 点 ) 的 横 坐 标 . 


2. 这 些 椭圆 的 与 纵 轴 平行 的 切线 ,所 有 的 切 点 在 一 通过 中 心 
的 直线 上 ,此 直线 对 模 轴 的 斜率 为 于 


高 尔 登 数据 图 上 的 等 第 椭 夯 及 其 切线 


( 转 引 自 KK. Pearson :tNotes on the biatory of correlation $. 
图 上 英文 说 股息 改 为 中 文 ) 
高 尔 登 现在 的 问题 ;就 是 要 找到 CX, 了} 的 一 个 二 维 分 布 ,来 解 
释 有 所 发 现 的 更 象 . 拒 他 的 假定 {中 亲 分 布 和 给 定 中 亲身 高 时 子 代 身 
高 的 条 件 分 布 都 是 正 态 一 一 当然 ， 这 也 可 理解 为 是 纵 数据 中 得 出 


的 结论 ) 和 上 上 述 发 瑰 结 合 , 他 已 经 有 也 :1”Y~N(0,s2)( 把 多 一 
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68. 25 和 了 了 一 68.25 代替 天 ,YY).2e 给 定 Y 了 二 y 时 罚 的 条 件 分 布 为 
N (rysrt (就 此 处 数据 -一 全), 要 找 (X,Y) 的 分 布 高 尔 登 把 这 个 


问题 提 给 剑桥 的 数学 家 犹 克 于 ,后 者 很 快 给 了 他 二 维 正 态 的 管 
案 +. 根据 以 上 研究 (包括 独 克 逊 的 数学 分 析 ) ,高 尔 登 在 1886 年 
发 表 了 关于 过 妆 的 开山 论文 4 遗传 结构 中 向 中 心 的 回归 哄 Regres- 
sion towards medioerity in heredity sttucture). 如 今 我 们 用 二 维 
正 态 密度 的 形式 ,很 容易 把 他 的 发 现在 数学 上 解释 清楚 . 

1. 形式 (11? 表 明 ,( 革 ,了 7 有 二 维 正 态 ,将 其 密度 写 为 (3) 式 的 
形式 ,其 中 a 二 a; 一 0[ 因 已 将 中 心 称 至 (68. 25,68. 25) 处 了 ， 


] I 2pry | 
itz) 一 exp| 2(1 — po oo et 


C12) 
2 : (£+7) 
其 中 a 一 20,7. 因为 中 亲 相 当 于 一 5 让 ,其 中 ;7 独立 ,各 有 方差 


or 为 相关 系数 (高 尔 登 交 章 发 表 时 尚 无 这 个 名称 )， 
2.《12) 的 等 值钱 为 同心 同 轴 相 侯 焕 图 . 


3. 等 慎 李 图 
x 2 “ 
+t (& > 0) C13) 


与 > 轴 平 行 的 切线 ,其 切 点 坐标 可 如 下 求 得 :在 此 点 有 9 一. 由 
(13) ,两边 对 x 求 导 , 有 


出 事 恒 35 年 ,1920 年 末 汞 * 虚 尔 进 在 相 关 的 后 史 福 记 3# 玄 中 ,个 订 于 为 何 高 
尔 登 未 直接 写 出 密度 
1 


一 一 一 一 并 a 让 
x i | dd 


1 

rp[ 一 zz 一 rm) 让 《11) 
即 昔 接 得 出 二 维 正大 密 度 . 对 这 一 点 现在 只 能 猜想 . 高 尔 登 在 数学 上 的 训练 很 有 限 ， 
此 ,也 许 他 未 能 其 其 在 图 中 扬 得 总结 出 一 个 入 晰 的 数学 担 法 , 我 们 知道 ,在 19 世纪 80 
年 代 , 昌 热 二 维 正 态 的 联 数 形式 已 汶 估 所 知 ; 它 作为 实际 的 二 组 统计 数据 的 模型 并 未 
确立 . 
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dy dy 
2z _ 2py “dr Yr _, 
oT TTT, 有 他 
dy __ 
出 二 二 中 :得 
可 - 
二 六 了 《1] 生 ) 


按 (8) 式 ,这 正 是 x( 子 代 , 作 为 因 变量 ) 对 y 的 回归 方程 ,回归 系数 
p 是 此 回归 线 与 y 轴 燃 角 的 斜率 , 按 高 尔 登 的 数据 为 二 . 


类 似 地 求 出 :等 值 柱 国 (4132 的 与 工 轴 平行 的 切线 ,其 切 点 在 
直线 


y 一 px (15) 
上 . 这 是 母 代 y( 作 为 因 变量 对 子 代 x 的 回归 方程 . 回归 系数 为 
p 休 . 按 高 尔 登 的 数据 为 村 


此 两 回归 系数 的 比值 
Pz 2 
oF) 


按 高 尔 登 的 数据 为 于 一 2, 正 与 地 一 2c3 符合 . 
3 

我 们 再 用 概率 论 的 语言 对 高 尔 登 的 发 现 作 一 个 总 结 : 在 亲 , 子 

两 代 身 高 联合 分 布 服从 二 维 正 态 且 各 自 的 分 布 服 从 同一 正 态 @( 稳 

定性. 这 是 客观 事实 ,不 是 数学 证 明 的 结果 ?的 条 件 下 ,向 中 心 回归 


1 


因此 处 母 伐 为 中 亲 , 故 分 布 稳定 性 的 杂 件 要 眩 改 为 : 子 代 身 病 有 正 态 个 市 
niaszzy 而 中 亲身 商 有 对 布 N| a | - 
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以 及 两 代 均 值 ,方差 何 以 能 保持 稳定 ,有 了 理论 上 的 解释 . 读者 也 许 
会 有 疑问 :为何 这 人 么 一 个 简单 的 数学 事实 被 赋 于 如 此 重大 的 意 尺 ? 
问题 是 :高 尔 登 的 出 发 点 只 有 两 代 服 从 同 -- 正 态 分 布 这 一 观察 到 的 
事实 ,其 他 的 一 切 都 是 从 实验 观察 数据 ( 甜 可 豆 .亲子 身高 ) 分 析出 
的 , 耳 当 时 二 维 正 态 这 模型 还 远 末 为 统计 学 者 就 悉 并 使 用 . 卡尔 。 
庶 尔 进 曾 在 其 前 引 1920 年 文章 中 对 噩 尔 登 这 天 工作 评价 说 :“ 凯 不 
登 矫 局 从 他 的 观察 值 中 产生 这 一 切 结论 ,在 我 心目 中 一 直 是 纯粹 从 
观察 值 的 分 析 中 得 出 的 最 值得 注意 的 科学 发 现 之 一 .” 


S7.3 高 尔 登 与 相关 系数 


现今 数理 统计 学 著作 中 通常 都 把 相关 系数 的 概念 连同 辐 妇 一 
起 归功 子 高 尔 登 . 星 说 这 一 般 讲 是 正确 的 ,但 还 有 若干 需要 提 到 的 
情况 . 
在 1888 年 之 前 ,关于 由 一 个 单一 的 数 亿 去 刻 划 二 维 分 布 两 分 
量 的 关系 的 程度 ,在 高 尔 登 的 工作 中 没 起 什么 作用 . 他 的 著作 中 也 
未 握 到 过 诸如 “相关 "之 类 的 和 名词. 直到 1888 年 人 冬天 ,他 在 分 析 一 
些 人 类 学 数据 时 ,注意 到 下 述 其 实 已 包括 在 前 面 的 理论 中 的 事实 ， 
石 数据 都 取 统计 尺度 , 则 不 仅 存 在 着 两 条 回归 直线 , 且 它 们 有 相同 
的 斜率 p. 实际 上 这 是 (14)、(15}) 两 式 的 简单 推论 ,因为 当 vo,=o， 
〈 取 统计 拷 度 ?是 使 这 成 立 的 一 种 情 吝 . 一 般 地 ,只 要 两 变量 都 以 各 
目的 标准 差 或 者 或 然 误 差 为 单位 就 可 以 ) 时 ,(14). (15 和 分别 成 为 
7 二 Py 和 y 一 Px; 其 斜率 都 是 pi 注意 这 是 对 不 同 轴 而 言 ,前 者 是 对 
> 外 的 斜率 ,后 者 则 指 对 x 轴 的 斜率 }. 因此 ,高 尔 登 指出 ,这 个 p 
可 忆 作 沪 ,之 间 “相关 紧 度 ”iclosceness of co-relatio0) 的 数字 指 
标 .后 来 他 取 名 为 “相关 指数 ”(index of co-relation). 起 初 , 他 坚持 
用 Co-relation 的 拼 法 而 不 用 现时 通行 的 Correlation ,原因 是 后 面 
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这 个 词 , 指 一 般 的 相关 ,在 科学 薪 作 中 早出 现 过 ,但 他 后 来 疏 用 
Correjationt. 他 指出 ,相关 的 存在 是 由 于 :两 个 变量 之 值 至 少 部 分 
二 受到 一 种 公共 原因 的 影响 . 

高 尔 登 在 上 述 杰 念 的 基础 上 和 发展 了 一 穆 用 图 形 佑 计 相 关系 数 
但 的 方法 . 设 有 变量 蔷 ,Y 了 的 一 些 分 组 数据 . 先 将 数据 中 心 北 ‘ 减 去 
中 位 数 ; 标 准 化 (以 标准 差 为 尝 位 ), 然 后 对 每 个 苹 值 ,算出 相应 的 
Y 值 和 的 中 位 数 mrx ,得 到 平面 上 举 宗 系 内 的 一 些 点 (rymx}{ 图 7.6 


中 的 0 0) 然后 ,对 每 个 Y 值 ,计算 相应 的 关 值 的 中 位 数 mY, 又 得 


到 男 -一 些 点 (Y ,my)( 图 7.6 中 的 x. 注意 ; 纵 坐 标 总 是 中 位 数 ). 
按 员 4 .019), 埋 论 上 这 些 点 应 茵 在 直线 : 

纵 坐 标 二 pp*， 和 模 坐 标 上 . 
通过 原点 作 一 条 直线 , 尽 可 能 
接近 这 些 点 *, 这 条 线 ( 对 横 
轴 的 ) 笠 率 r 就 作 汶 基 , 了 之 
癌 相 关系 数 和 的 估计 值 . 1888 
备 , 高 尔 登 使 用 人 的 5 竺 长 , 身 
高 ?数据 348 个 实施 了 这 个 方 
法 .他 判 断 相 关系 数值 为 
0.8, 这 是 统计 史上 第 一 个 正 
式 发 表 的 相关 系数 数字 .高 尔 
登 一 直 用 数据 的 中 位 数 而 非 
算 本 平均 . 对 正 态 而 言 这 二 者 差 萝 不 太 , 后 来 埃 其 浇 斯 售 中 位 数 而 
改 用 算术 平均 . 

局 尔 登 的 工作 发 表 后 相当 一 段 时 期 内 ,学 术 界 反应 平淡 . 原因 


图 7.6 


一 


re- 
上 1. 


更 在 通用 的 " 柑 关 系数"icoefficient of correlation 一 坷 最 本 出 埃 其 涅 斯 于 
1892 年 在 其 沦 立 * 相 美的 平均 值 3icorrejated averages? 中 所 引进 . 此 前 , 破 尔 登 曾 钝 胃 
这 “局 未 登 国 数 "这 个 名 称 . 

如 凯 尔 登 当 时 是 用 目测 法 ,他 当时 还 末 能 抒 量 小 二 物 旋 用 到 此 处 . 后 来 约 东 在 
1897 年 首先 把 最 小 二 知 法 与 权 泥 鸯 妇联 又 起 来. 
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之 一 是 他 的 这 些 思想 和 方法 ;是 在 亲 于 代 某 种 性 状 ( 身 高 } 的 遗传 
的 研究 中 作出 的 ,人 和 们 怀疑 它 是 否 适 用 于 其 他 性 状 . 至 于 能 否 用 于 
滥 传 以 外 的 领域 .疑问 就 更 多 ,甚至 高 尔 登 本 人 也 曾 有 过 这 种 疑 
问 .还 有 ,高 尔 登 工作 初 发 表 时 ,相关 回归 方法 还 远 未 整理 成 一 种 
合用 的 形式 . 例如 相关 系数 如 何 计 算 , 其 误差 如 何 , 注 及 到 3 个 或 
更 委 变 量 的 问题 如 何 处 环 等 ,都 是 实用 上 重要 而 尚未 解决 的 问题 . 

高 尔 登 在 1889 年 出 版 了 《 自然 遗传 3 一 书 , 其 中 闪 结 了 他 和 在 这 
方面 的 工作 .此 后 他 就 脱离 了 这 个 领域 的 研究 而 转向 指纹 学 . 任 好 
当时 有 几 位 对 他 的 思想 有 理解 的 大 学 者 ,他 们 的 工作 发 展 了 高 尔 
登 的 理论 和 方法 ;使 之 达到 一 个 相对 完美 的 境地 . 这 中 间 主 要 的 人 
物 有 埃 其 湿 斯 和 和 卡尔， 皮尔 扣 等 . 他 们 与 高 尔 登 一 样 有 资格 镇 列 
为 相关 回归 这 个 领域 的 竟 基 人 . 


8387.4 埃 其 涯 斯 


埃 其 温 斯 (Erancis Ysidro Edgeworth ,1845 一 1926) 现 今 在 概 
率 论 和 统计 学 的 知名 度 , 主 要 来 自 他 所 麟 立 的 一 种 分 布展 开 式 
一 一 埃 其 涛 斯 展开 ,其 实 他 在 统计 学 上 的 主要 贡献 是 在 相关 回归 
领域 . 

统计 史学 家 斯 蒂 格 勒 认 为 ,高 尔 登 . 埃 其 湿 斯 与 皮尔 进 3 人 和 联 
手 在 统计 学 中 掀起 了 一 场 革 命 . 在 这 当中 高 尔 登 是 思想 家 .但 他 抽 
于 数学 且 不 善于 从 自己 的 僻 造 性 思想 中 提取 出 全 部 果实 ,外 玉 了 
许 委 迷 等 . 而 埃 其 深 斯 是 一 个 思想 周密 的 理论 察 ,在 高 尔 登 的 听 炊 
中 他 几乎 是 惟一 的 一 个 从 高 尔 登 的 合计 迷 答 中 看 清楚 事情 的 实质 
所 在 ;并 有 在 数学 上 清 蹲 表达 的 可 能 ,以 至 最终 可 以 将 这 一 套 方法 
推 向 宽广 的 应 几 领 域 . 

埃 其 温 斯 出 生 在 爱尔兰 , 瑚 年 时 所 受 教 育 为 古典 文学 . 1867 年 
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进入 牛津 大 学 ,2 年 后 毕业 ,以 后 还 学 过 法 律 . 在 这 同时 他 自修 大 学 
数学 课程 ,达到 很 高 的 水 平 . 其 间 他 花 了 大 量 的 时 间 与 精力 去 研读 
概率 论 和 最 小 二 乘法 理论 . 熟悉 魁 特 奈 特 和 高 尔 登 的 著作 . 这 样 的 
理论 修养 在 当时 的 英国 统计 学 界 也 算是 比较 特 出 的 . 

埃 其 温 斯 早期 的 统计 学 工作 集中 在 一 个 问题 :如何 将 在 正 态 
误差 沦 中 建立 的 一 套 方法 移植 于 社会 统计 间 题 . 他 在 这 方面 理论 
上 的 代表 作 是 发 表 于 1885 年 的 两 夭 文 章 , 其 一 题 为 {统计 学 方 
法 》, 另 一 篇 题 为 (观测 数据 与 统计 数据 》, 已 在 第 五 章 中 提 及 过 . 埃 
其 湿 斯 在 这 篇 文章 中 的 提 法 帮助 我 们 了 解 问题 症结 之 所 在 , 即 19 
世纪 的 学 者 对 于 下 述 两 类 数据 可 否 用 同一 种 方法 去 处 理 有 怀疑 ， 
一 类 是 对 一 个 对 象 a 的 重复 观测 值 , 一 类 是 对 一 些 个 体 各 自 的 观 
测 值 . 埃 其 涯 斯 的 功绩 在 于 对 些 作 了 肯定 的 符 复 ,其 代表 性 的 例子 
是 : 设 有 两 个 (样本 ) 均 值 垃 .y, 其 标准 差分 别 为 .y., 他 用 
二 是 你 准 正 态 分 布 的 命题 去 计算 其 或 然 误差 ,通过 这 个 方 
法 把 概率 分 析 引 进 到 社会 数据 的 比较 中 . 这 种 观点 后 来 日 浙 被 学 
界 所 接受 ,这 对 概率 分 析 法 (统计 推断 法 ) 渗 人 到 社会 统计 问题 中 
去 起 了 很 大 的 作用 . 在 如 今 我 们 学 习 数 理 统 计 学 时 ,把 这 一 切 看 得 
很 简单 :只 要 认定 数据 是 从 某 一 总 体 ( 如 正 态 总 体 ) 中 抽出 , 则 适用 
该 总 体 之 下 的 统计 方法 ,而 没有 想到 这 背后 还 有 -一些 实际 的 考虑 ， 
兽 困 惑 了 好 几 代 的 学 者. 

埃 其 温 斯 对 相关 回归 的 主要 员 献 包含 在 他 1892 年 写 的 《相关 
的 平均 值 ) 一 文中 ,其 后 几 年 他 还 发 表 了 几 夭 有 关 的 文章 ,和 伯 主 要 
是 对 此 文 的 进一步 发 挥 而 非 创新 . 

在 上 述 论文 中 ,他 给 了 回归 一 个 数学 式 的 ,与 踪 传 无 关 的 意义 
本 来 ,高 尔 登 研究 中 出 现 的 回归 线 也 正 是 一 种 条 件 期 望 ,可 因为 整 
个 研究 重点 在 其 遗传 的 一 面 ,这 一 点 未 能 作为 一 个 独立 的 要 素 突 出 
出 来 . 现在 埃 其 滩 斯 的 提 法 则 超脱 了 变量 的 实际 含义 ,成 为 一 个 缠 


数学 定义 . 这 当然 为 回归 方法 应 用 于 广泛 的 领域 打开 了 门 径 ， 
IO 


为 实现 这 个 定义 , 埃 其 湿 斯 先 引 进 一 般 维 数 的 正 仿 分 布 . 用 现 
今 的 记号 , 若 mr 维 变 量 (X,,…, 革 ,。) 有 窗 沸 密度 (他 一 开始 就 把 期 
望 取 为 各 

了 EXP 一 
让 
则 称 为 天 维 正 态 , 这 里 4 一 4 为 站 维和 下 定 方 阵 . 埃 其 源 斯 想 要 
通 这 入 /zs 的 2 阶 定 表 出 a 他 在 关 = 王 3 时 得 出 了 和 警 案 并 认为 
这 对 一 般 半 也 成 立 ! 第 五 章 (15) 式 ], 后 染 由 卡尔 ， 度 尔 吉 在 1896 
年 给 出 严格 的 证 明 . 

埃 其 温 斯 推导 条 件 期 望 ECX) 1X; 二 达 。 二 ew) 的 方法 很 
别致 . 痛 先 ,六 , 的 条 件 分 布 密度 是 
和 (17) 
其 中 总 是 (Er 的 密度 . 埃 其 深 斯 看 出 Cr | zw) 对 
zi 而 言 急 是 正 态 密度 ,因此 ,这 条 件 密 度 取 最 大 值 之 点 ,就 是 所 凌 
的 条 件 期 望 .注意 到 (17)? 式 中 的 g 与 无 闫 ,这 无 异乎 要 求 画 数 
2 47 作 为 zi 的 图 数 的 最 太 值 点 [(rs, zao) 固 定 ]..r4zr 与 有 
关 的 部 分 是 


Fx EE mn) = 


mh 
Atr) 一 ” ct -二 TS ， 
1 = 锯 


令 Cr) 二 人 ,和解 中 


Xl| 二 一 2471 Da (C18) 

此 起 右边 就 是 Bt | 六 ,二 x 交 。, 二 Tw) :而 上 式 就 是 以 革 为 因 

变量 .rm 为 自 变 量 的 回归 方程 [车 各 变量 期 望 不 设 为 0, 在 

《C183) 式 中 以 zi 一 BCX,) 估 赫 zj]. 1896 年 卡尔 。 应 尔 避 通过 各 变量 
的 标准 关 和 相关 系数 写 出 (5182?， 即 我 们 现在 引见 的 形式 . 

埃 其 涯 斯 的 娘 一 个 重要 贡献, 是 给 出 了 样本 相关 系数 的 公式 ， 

就 是 现在 我 们 习 见 的 那 种 形式 . 他 的 推理 基于 高 尔 登 的 基本 结果 : 
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者 疼 ,Y 期 望 为 0 且 标 淮 差 相间 , 则 回归 方程 y=px 的 系数 p, 就 
是 到 ,了 之 则 的 相关 系数 . 
现 设 有 数据 {xi;y) ,1 志 ? 所 ,将 其 中 心 化 标准 化 : 
x 


Ty 时 由 


:] 二? 了 


此 处 5 一 7 (一 二 se 一 > (9 一 5)*. 则 对 每 个 站 妆 都 是 p 的 
一 个 镶 值 . 磋商 尔 富 的 研究 成 果 中 ,已 知 给 定 总 值 了 的 条 忻 方 差 
为 Ip , 故 交 的 篆 件 方差 为 半 一 f .因此 ， 若 取 世 ia 的 加 


权 和 作为 p 信守 . 贡 妆 的 相应 到 xr73 ,于 是 得 (注意 Par 
1, 权 数 和 为 1} 合 计量 


ie (19) 
再 以 x 1y, 之 值 代 阿 ,得 到 习 见 的 形式 


Sx — Xly; — Y) 
"一 1] 


( 20) 


他 还 在 这 基础 上 ， 使 用 与 上 述 类 似 的 方法 ,导出 - 的 标准 差 的 表达 
式 | Ge (这 个 结果 有 误 ， 正确 值 为 | 一 > |. 


可 惜 的 是 , 埃 其 深 斯 这 些 成 就 后 来 基本 上 漂 没 无 间 ， 教科 书 圭 
如 今 一 般 都 把 这 些 结果 归于 卡尔 ， 皮 尔 避 的 名 下 . 这 是 因为 埃 其 
源 斯 不 长 于 用 数学 清晰 表达 其 想法 ,所 用 的 记号 每 重 ,办 而 他 揭 文 
草 很 难 被 人 理解 . 即 在 上 上 述 公 式 (20) 的 推导 中 ,就 颇 有 些 会 糊 之 处 
《上 面 的 推导 过 程 经 过 梳理 ). 其 次 , 埃 其 涯 斯 未 能 在 广泛 的 实际 癌 


是 中 使 用 这 些 公 式 , 他 栈 于 亲自 作 观 罕 收 集 数据 ,而 使 用 恺 入 (如 
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高 尔 登 ?的 数据 作 些 计算 . 相反 ,皮尔 进 在 数学 表述 上 清晰 , 且 在 
1896 年 的 一 篇 论文 尽数 学 用 于 进化 论 正 访 中 对 当时 已 知 的 一 切 
作 了 很 好 的 综合 和 整理 ,成 为 早期 回 时 理论 中 的 标准 文献 . 当然 ， 
卡尔 。 上 皮尔 了 还 在 统计 学 界 的 巨大 声望 也 是 一 个 重要 的 外 案 ， 

卡尔 。 虚 尔 称 的 儿子 爱 根 ， 皮尔 透 兽 写 过 一 篇 题 为 《1885 年 
一 1920 年 间 数 理 统计 学 的 发 展 } 的 文章 ,其 中 对 “ 像 一 个 有 埃 其 深 
斯 这 样 的 天 才 的 人 "竟然 “对 数理 统计 学 的 主流 发 展 影响 如 此 之 
小 ”表示 了 居 惜 之 情 , 他 也 耸 析 了 其 原因 所 在 : 

1. 他 的 方法 中 涉及 逆 概 率 的 司 用 ,这 是 其 他 人 当时 不 能 接受 的 ， 

2. 季 在 表述 上 流 于 族 汲 ,对 数学 家 疝 乏 吸引 力 . 

3， 他 来 能 建立 自己 的 学 派 , 吸 引 一 些 学 生 沿 着 目 己 的 方向 知 
工作 ， 

4. 他 未 能 把 努力 集中 于 任何 特定 的 应 用 领域 ,也 未 能 使 人 相 
和 信和 他 提出 的 方法 确实 获得 了 有 价值 的 结果 . 

应 该 说 , 爱 根 的 分 析 基 本 上 是 中 肯 网 ;他 提出 了 一 个 有 鸭 的 科 
学 家 和 价 得 借鉴 的 问题 :如何 推销 ”自己 的 成 果 并 僵 其 具有 显示 谋 . 
另 一 方面 也 应当 指出 ,现今 的 统计 史家 对 埃 其 湿 斯 的 贡献 已 给 了 
他 应 得 的 评价 ,历史 终究 不 会 埋设 一 个 确 有 贡献 的 大 . 


$37.5 皮尔 还 和 约 尔 


卡尔 ， 皮尔 迁 (Karl Pearson ,1857 一 1936)18798 年 在 剑桥 大 

学 国王 学 院 获得 数学 学 位 ,以 后 妃 年 间 兽 对 德国 史 ,物理 学 和 科学 

哲学 感 兴趣 . 1884 年 成 为 伦 就 大 学 应 用 数学 教授 . 他 是 公认 的 现 

拭 统 计 学 疯 基 大 之 一 ,在 统计 学 上 有 多 方面 的 贡献 .相关 回归 是 其 

中 的 一 个 重要 方面 . 他 在 数理 统计 学 上 的 贡献 除 研究 成 果 外 还 有 有 

培养 人才. 他 在 伦敦 天 学 学 崇 主 持 “ 高 尔 谷 实验 室 ” 儿 年 ;在 20 世 
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纪 前 期 该 实验 室 是 国际 上 一 个 主要 的 统计 学 研究 教学 中 心 , 许 堵 
在 统计 史 土 夫 名 易 里 的 人 物 都 在 那里 学 习 或 工作 过 ,这 和 包括 发 现 
? 分 布 的 哥 色 特 (Siudent) ,假设 检验 和 置信 区 间 理 论 的 葛 基 者 泰 
党 和 过 根 ， 皮尔 名 ,对 回 妇 分 析 作 出 过 重大 贡献 同时 也 是 时 间 序 
列 分 析 的 莫 基 者 之 一 的 约 尔 等 . 费 葡 尔 在 进入 统计 学 研究 工作 之 
前 曾 研 读 过 皮尔 还 的 系列 论文 (数学 用 于 进化 论 》, 在 这 个 意 浆 上 
可 以 说 他 是 费 的 大 门 导师 . 虽说 二 人 后 来 在 学 术 观 点 上 时 有 人 分歧 ， 
但 在 1915 年 之 前 二 大 莹 保持 和 良好 关系 有 在 有 关 相 关系 数 分 布 间 
题 的 研究 上 .有 过 一 定 程度 的 合作 关系 . 

诺尔 进 早期 人 1892 年 前 ) 的 科研 教学 活动 涉及 许字 方面 ,但 统 
于 党 在 其 中 只 是 次 要 的 .他 在 晚年 的 回忆 中 将 他 的 兴趣 转向 到 统 
计 字 一事 归 功 于 商 尔 登基 其 著作 # 自然 超 传 但 据 文献 记载 ,他 起 
切 其 实 对 蔚 不 登 的 工作 反应 冷淡 ,说 他 个 和 人 并 不 觉得 将 高 尔 登 美 
于 纺 高 的 遗传 的 结果 用 于 所 有 的 遗传 问题 是 合适 的 ,认为 将 精确 
科学 (如 数学 ) 用 于 描述 性 科学 {如 遗传 学 和 既 济 学 之 类 ) 有 着 相当 
的 危险 , 斯 攻 格 勒 认 为 ,促使 皮尔 过 注意 高 尔 登 的 工作 并 因此 将 他 
Fl 向 统计 学 方向 的 关键 人 物 , 是 埃 其 湿 斯 . 

z 卡尔 ， 皮 尔 迁 在 相关 同 归 方 面 的 捍 期 {1898 年 前 ? 届 献 可 归 
纳 为 以 下 3 个 方面 . 

站 完 , 他 对 当时 已 有 但 表 述 会 混 不 清 的 结果 放 了 一 个 系统 的 
综合 和 整理 . 这 一 工作 不 能 单纯 看 成 是 复述 ,因为 当时 尚 在 理论 的 
草创 时 期 ,不 明确 的 东西 很 专 . 一 个 例子 是 前 面 论 及 的 由 埃 其 滥 斯 
音 先 提出 的 关于 多 维 正 态 及 一 般 园 归 函数 的 定义 问题. 在 这 种 罗 
理 中 也 包含 了 发 展 . 例如 ,皮尔 避 在 1898 年 一 简 文 章 必 数学 用 于 
进化 论 闻 ) 中 ,证 明了 线性 回归 (18) 具 有 如 下 的 性 质 ;在 到,,…， 
sn= 了 一 切线 峰 组 合 中 ,性 有 (18)? 右 边 与 筷 有 最 大 的 相关 系数 
(现在 我 们 把 这 是 伐 及 | 对 ( 巧 :vv ,及 ) 的 复 ( 全 ) 相 关系 数 , 吉 卡尔 
* 皮尔 人 避 可 被 认为 是 这 个 概念 的 引信 者 ). 

其 次 ,他 用 极 大 似 然 法 对 相关 系数 的 人 千 计 间 题 作 了 一 个 新 的 
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处 理 . 他 从 一 个 期 望 鸭 0 的 2 维 湛 访 密 典 


] 
2 1 一 ~ 一 _ 
CATT Ooo) exp| 2 By 


= (rs ‘21) 
出 发 ,p 就 是 要 入 计 的 相关 系数 ,a .as 分 别 是 xyy 的 方差 . 设 有 
样本 Cr, ) 1 Si En. 计算 Flix,y yi 并 对 7 二 1,… yr 相 汪 ,近似 地 

Dx Dy 
认为 一 = ， 一 二 gz 站 诺尔 这 心 月 中 ,样本 量 nH 碾 是 很 


友 , 所 以 认为 取 这 种 近似 从 实际 角度 看 没有 问题 ). 由 (21}) 得 


站 rw) 一 Tefi 一 产 ) exBp| 一 人 全 ， 
r 一 | 


SS 


(22) 
Dy, 
C7 元 CT 者 与 PP 无关. 方式 对 p 求 极 太 值 ,简单 计算 得 


"1 
十 ， 
1 一 


这 里 上 条 4 一 


出 被 大 值 操 为 p 一 和 把 4 表达 去 中 的 oa 和 6; 分别 用 


2 


一 1 


和 


代替 然后 ,对 一 般 均值 不 必 为 0 的 情 入 ,用 站 和 > 


一 多 代替 x,，Yy,: 得 到 相关 系数 6 的 估计 如 (20) 式 所 示 . 他 还 得 出 


> 标准 差 人 了 表达 式 “一 ?2 
洋 本 相关 系数 = 标准 差 表达 式 -人 全， .这 有 错误 ,后 来 他 在 


1898 年 纠正 了 这 个 错误 (前 引文 章 ), 得 到 正确 表达 式 为 2 

人 下 上 朋 面 我 们 曾 提 到 对 , 雇 往 一 直 用 " 模 *tmodulu} 闵 交 量 误差 太 小 ,; 它 是 方差 的 2 
俏 . 这 与 早先 常 将 正 态 密度 写 为 。， exp| 一 到 | 的 形式 有 关 . 方差 和 标准 差 的 称呼 是 
卡 东 ， 皮尔 履 在 1893 年 引进 的 . 
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(这 也是 很 广 时 的 南 近 表达 式 )， 

C20) 式 定 广 的 > 现 称 为 (相关 系数 的 ) 皮尔 如 履 积 估计 , 虽然 
它 形式 上 是 从 极 太 似 然 的 想法 而 来 ,实际 上 上 应 乐 提 是 二 只 叶 斯 的 
观点 杷 (22) 看 成 是 产 的 后 验 密 摩 出 发 . 当然 我 们 注意 天 推理 中 的 

> za Dy 

许多 不 严谨 之 处 ,例如 用 二 :一 和 二 一 取代 o* 和 as?, 以 及 求 出 
解 入 后 再 作 这 种 取代 等 ,又 先 令 期 望 为 0 事后 用 一 x 和 和 3 一 y 取 
代 二 和 > 在 数学 上 也 下 合法 .这 问题 的 严格 处理 应 当 是 把 表达 式 


| | ， Cn 一 ao 
Tsxme 了 一 站 | exp| 2f] 一 2 o,? 


2p{7, 一 如 一 起 ) 下 (Cy; | 1 


中 的 .52osar 和 租户 看 作 未 知 参 数 而 对 它们 求 极 值 点 . 可 以 证 明 
(CW GC. R. Raotl.inear Statistical Inference jp. 529~531}, 对 w 而 
言 结 加 与 前 无 异 . 

志 尔 *， 诺 尔 进 的 相关 系数 乘积 笔 佑 计 > 与 埃 其 瀑 斯 给 出 的 无 
措 , 后 者 在 时 间 上 里 了 4 年 ,可 异 的 是 挨 黄 瀑 斯 的 结果 后 来 种 没 无 
图 . 这 个 情况 我 们 在 前 面 已 指出 过 了 ， 

诺尔 于 的 个 计生 是 一 种 征 估 计 - 在 他 用 上 述 方 法 导出 情 计 * 
时 .他 已 发 明了 和 矩 估计 法 . 因此 我 们 不 禁 会 产生 一 个 问题: 他 为 何 
不 在 这 个 问题 上 使 用 自己 的 矩 法 ,而 要 用 一 种 他 身 己 也 不 其 玩 同 
的 方法 ”一 -上 内 时 斯 法 来 处 理 这 个 问题 了 ? 更 在 我 们 自然 无 法 对 此 
作 可 靠 的 回答 . 猜想 的 一 种 可 能 情况 是 ;皮尔 逊 当 时 发 明 的 矩 法 ， 
征 针 对 一 项 特殊 应 用 5( 见 第 五 章 ), 它 不 是 作为 “第 一 原则 ”(first 
，Principle ) 而 提出 ,而 是 作为 最 小 二 乘法 在 这 个 特例 下 的 族 生 物 . 


由 栈 尔 迁 一生 不 试 同 由 时 斯 方法 . 1916 年 ,他 在 一 篇 关于 样本 相关 系数 的 论 立 
中 ,入 责 费 鞭 东 1915 年 发 表 的 关于 样本 相关 系数 精确 分 布 的 论 训 用 了 中叶 斯 先 验 向 
布 . 费 歌 和 尔 对 此 进行 了 反 驶 .这 是 二 人 关系 紧张 的 开 妓 ， 


二 7 让 


料想 包括 他 自己 在 瞧 的 当时 的 学 者 都 并 来 把 它 看 成 一 个 可 普遍 使 
用 的 方法 . 例如 , 费 葡 尔 在 1912 年 关于 要 大 要 然 个 计 的 论文 中 职 
摸 评 过 目 汶 ,认为 其 侧 去 理 沦 上 的 根据 (A choice has been made 
without theoretical justification). 其 实 , 我 们 现在 知道 , 官 汪 的 和 彬 
据 在 于 大 数 律 . 大 数 律 在 当时 是 大 们 局 知 的 ,为 何 当 时 的 学 者 (如 
费 歇 尔 ) 没 有 考虑 这 个 角度 ,也 是 一 件 有 些 令 人 困惑 的 事情 . 

第 三 ,皮尔 还 大 量 地 将 这 些 方法 使 用 到 生物 测量 数据 ,对 将 这 
一 方 活 推 同 广 泛 的 座 用 领域 起 了 极 大 的 作用 ,这 一 后 的 意 头 尖 不 
可 小 视 ， 

当时 有 一 位 生物 学 家 兼 统 计 学 家 威 尔 登 (W.F.R. Welidon)， 
与 凯 尔 登 . 埃 其 深 斯 和 皮尔 人 进 等 人 人 都 保持 密切 的 关系 . 他 对 高 尔 登 
的 发 现 极 感 兴趣 ,是 相关 方法 早期 发 展 的 有 贡献 的 一 位 学 者 . 皮尔 
提 1920 年 在 其 4 相关 的 历史 注 记 ?一 文中 写 道 :高 尔 登 # 自 然 址 
忧 》 一 书 的 出 版 为 相关 领域 至 少 召 来 了 3 个 人 大: 威 尔 登 . 埃 其 涛 斯 
和 我 自己 .他 还 名次 提 到 威 尔 登 作为 他 早年 工作 的 有 力 询 激 绩 
省. 威 尔 登 自 1889 年 起 在 普 利 匡 斯 测量 是 的 各 器 官 数据 ,后 来 又 
扩大 到 春 , 算 了 大 量 的 相关 系数 . 其 中 有 5 种 是 22 对 器 官 的 相关 
值 ( 采 用 图 示 法 ), 其 目的 是 想 证 骨 给 定 的 一 对 器 官 度量 之 间 的 相 
活 瑟 前 种 无 关 , 皮尔 还 用 自己 的 公式 重新 作 了 计算 并 用 其 或 然 误 
差 的 公式 估计 其 误差 . 他 说 明 : 威 尔 登 提供 的 这 些 数 据 是 促使 他 研 
% 7 的 或 然 误差 的 动力 . 

总 体 为 正六 J 保证 了 回归 的 线性 . 皮尔 避 在 处 理 各 种 数据 时 
会 砸 到 回归 并 非 线 性 的 情况 ,由 此 推出 数据 所 来 自 的 母体 并 非 正 
生 的 . 这 使 皮尔 了 还 提 出 问题 :; 找 出 尽 可 能 广泛 的 一 类 偏 态 曲面 能 捞 


心 事 元 分 布 的 “ 正 " 态 看 上 去 不 像 在 一 元 情况 下 那么 一 目 了 热 , 因 为 在 ec ，exp 
(一 们 由 中 当 44 丰 为 对 惠 形 时 , 帝 度 昌 面 从 既 丰 的 堂 标 系 媳 上 去 是 * 含 的. 可 有 巧 如果 
将 学 标 轴 正 交 地 旋转 到 分 布 的 主轴 , 则 站 在 新 坐标 系 的 角度 看 * 正 *? 态 性 变 得 一 上 月 了 
热 . 这 在 数学 上 诗 不 过 是 找 一 个 正 变 市 阵 叫 ,全 户 AP 为 对 能 阵 . 布 拉 瓦 彼 斯 在 其 1846 
a 记 福 着 到 此 问题 并 解雇 了 2 弘 的 情况 ,一 般 情 况 是 卡尔 : 皮尔 于 在 1901 年 


177 


述 这 类 数据 .他 在 这 个 问题 的 一 元 情况 上 的 成 功 自 然 很 可 能 是 他 
所 出 这 个 问题 的 一 个 动力 并 相依 问题 能 育 适 当 的 解决 ,皮尔 示 沿 
生 他 在 处 理 一 维 问 题 时 的 作法 导出 曲面 所 满足 的 微分 方程 .但 如 
他 自己 1920 年 时 所 说 :" 我 得 到 了 这 些 系 统 的 微分 方程 ,但 在 以 后 
长 过 25 年 的 和 时间 内 ,; 昌 然 我 不 时 地 回 到 这 些 方 程 ,但 未 能 成 功 地 
找到 其 解 .” 

从 我 们 现今 的 观点 看 ,皮尔 避 在 这 个 癌 题 上 的 挫折 有 其 必然 
性 . 只 要 看 看 在 一 - 维 的 情况 ‘那里 事情 当然 简单 得 多 ), 虽 则 皮尔 导 
曲线 族 不 和 失 为 一 个 臣 太 的 成 功 ,; 但 用 这 种 非 自 然 的 方式 产生 的 曲 
线 终究 未 能 为 处 理 人 篇 态 数 据 提 侍 一 个 合用 的 工具 .在 高 维 的 情况 
成 功率 县 热 更 小 . 实际 上 ,回顾 凡 十 年 来 密 元 统计 分 析 的 发 展 , 人 人 
们 不 村 会 有 这 样 的 感 别 , 它 终究 设 有 能 超出 密 元 正 态 这 个 攀 蔽 也. 

这 里 就 访 工 皮尔 避 的 学 生 约 尔 了 . 约 尔 正 是 从 对 这 个 问题 的 
考虑 人 手 , 采 取 了 与 庶 尔 逊 示 同 的 想法 ,对 回归 分析 作 了 重大 的 推 
进 , 圆 满 地 结 更 了 相关 回归 这 个 领域 的 *Mark 7”( 爱 根 :， 皮尔 进 
语 , 见 后 ?这 一 章 . 

齐 治 ， 万 德 捷 。 和 尔 (George Udny Yule,1871 一 1951) 出 生 
在 东 格 兰 哈 丁 顿 附 返 一 个 富有 文学 稍 政 治 传 统 的 世 穴 .16 罗 时 大 
伦敦 天 学 学 院 学 习 工 程 .他 好 像 并 不 太 热 心 这 一 行 ,于 是 在 
1890 年 一 1892 年 去 波恩 向 替 芝 学 习 无 线 电 物理 . 当 他 1893 年 返 
器 伦 部 时 ,皮尔 惕 给 了 他 一 个 助手 职位 . 他 起 初 的 意向 是 研习 应 用 
数学 ,但 和 皮尔 逊 这 一 工作 关系 使 他 在 1895 年 成 为 了 .-- 位 统计 学 
家 . 他 也 在 这 年 被 接纳 为 英国 皇家 统计 学 会 会 员 ,1922 年 成 为 皇 
震 学 会 会 员 . 

汐 尔 的 工作 算 初 是 在 卡尔 “皮尔 避 的 影响 之 下 . 例如 ,在 有 关 
“诺尔 过 曲线 芒 "的 工作 中 他 曾 在 提供 实地 数据 (多 是 社会 性 的 ,这 


中 这 向 当然 只 能 有 末 妊 地 去 理解 . 例如 .晚近 兴起 的 离散 事 元 分 析 下 孝 元 非 参数 
和 统 尘 ,日 不 模 因 于 生态 王国 , 这 时 的 意思 捉 : 与 一 元 分 析 中 有 众 起 首 用 的 分 布 的 局 面 
钼 比 , 在 束 元 分 析 中 末 能 出 现 一 个 有 较 大 作用 的 非 正 态 分 布 . 
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一 点 意义 很 大 . 皮尔 逊 恨 常 使 用 的 是 遗传 学 方面 的 数据 ,这 可 能 多 
少 妨碍 了 广大 的 科学 界 对 他 的 工作 的 理解 ) 方 面 做 过 帮助 ,但 很 快 
他 就 开始 走 自 已 的 路 . 这 主要 表现 在 以 下 两 个 方面 . 首先 , 约 尔 把 
注意 力 集中 在 问 归 关 系 本 身上 面 ,而 皮尔 避 则 执着 于 这 一 点 ;研究 
相关 变量 必须 与 “相关 曲 而 ”( 即 密度 曲面 ) 相 联系 ,而 不 能 仅 着 有 最 
于 回归 关系 . 其 次 ,由 于 这 -看 法 ,使 维尔 实现 了 把 相关 回归 这 一 
档 子 事情 与 最 小 二 乘法 联系 起 来 ,填补 了 理论 中 的 这 个 重要 的 缺 
口 ， 

约 尔 在 1896 年 发 现 并 告知 了 皮尔 进 下 面 的 结 符 ( 仍 设 变量 有 
期 望 0) ;车 已 知 回 归 [ 却 EC(Y | 玉 )1 有 直线 形式 , 则 其 形式 不 论 人 XX， 


7) 服 从 正 态 与 否 都 是 > 一 |。 全 |x. 在 实际 问题 中 ,可 能 出 现 数据 


革 侨 态 而 闸 妇 册 是 接近 线性 者 ,这 时 在 正 态 情 况 下 发 展 的 方法 (如 
皮尔 避 移 张 积 算 估 计 ) 可 照 用 不 误 , 这 就 扩大 了 应 用 范围 . 有 意义 
的 是 :在 约 尔 关心 的 社会 统计 领域 ,这 种 情况 莽 多 . 约 尔 这 个 结果 
曾 被 皮尔 避 作 为 一 个 注解 收 进 他 的 一 篇 工作 (对 优先 权 作 了 声 
明 ), 但 从 他 给 约 尔 的 信 中 看 出 ,皮尔 避 并 不 记 为 这 有 多 大 意义 ,他 
仍 认 为 主要 问题 在 于 发 现 作 为 背景 的 篇 态 分 布 ， 

约 尔 这 个 结果 还 可 以 往 前 推进 一 步 ; 即 使 回归 是 曲线 的 但 如 
我 们 起 用 一 条 直线 来 近似 地 代替 它 , 则 这 条 直线 ,如 果 用 最 小 二 乘 
准则 , 仍 奶 上 述 一 样 . 这 相当 于 挨 出 常数 4a.5 使 EC(Y 一 a 一 bpX)? 最 


小 ,结果 易 得 出 为 a 一 0,5 一 他 . 这 个 想法 使 他 把 相关 回 妇 与 最 小 


一 素 法 接 上 关系 ,具体 如 下 {我 们 按 习 惯 挤 换 了 原文 中 z+ 和 的 
地 fi) ; 坟 在 哩 变量 小 | 外 作 了 了 好 ， 次 观察 得 | se 以 Y, 坦 后 


一 


CY Oy 


者 的 算术 平均 ,oz 记 二 全 一 一 ~. 约 尔 可 用 a 十 bz, 来 近似 闷 . 


ee 


1 或 者 说 在 分 组 数据 (这 在 当时 和 贸 流行 7di, 自 塞 时 区 有 联 组 中 值 xx, 那 一 行 中 的 各 
个 值 . 
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A 一 y; 一 《aa 十 mr rr 一 ] ,iv . 
药 尔 个 出 如 了 的 分 解 式 : 

人 (Cy,, -上 一 pr, -一 了 十 rd’ ， 

了 一 | 


于 是 有 


My i ™ » 
> > Cy a kx) Zor 十 Dd 


“< 一 1] 


以 吉 权 和 TW 二 > wa 作为 通 近 的 目标 函数 考 虚 到 > no 与 4、 


的 选择 无 其， 于 是 a、 a 的 决定 归结 为 使 上 式 左边 达到 最 小 ,这 就 
是 最 小 二 磁 解 . 

约 尔 在 上 述 挫 导 中 用 的 一 个 自 变 量 对 凶 个 因 变 量 介 的 形式 源 
于 当时 的 习惯 ,这 当然 不 影 啊 普 遍 性 ,因为 在 上 述 推导 中 并 未 限制 
n>]1( 当 热 , 在 二 1 时 涉及 ao 的 项 没有 ). 

百 些 统计 党 震 认 为 ,卡尔 。 皮尔 和 避 终 其 一 生 没 有 认同 药 尔 的 
这 一 作法 . 当然 这 不 是 因为 他 不 理解 其 中 的 数学 , 太 仍 是 在 于 曾 在 
前 面 指出 过 的 他 那个 观点 . 他 在 给 约 尔 的 信 中 就 此 事 写 道 :在 旭 特 
理学 那样 的 精确 科学 中 你 可 以 有 变量 之 间 的 精确 关系 ,但 是 在 像 
生物 学 这 种 描述 性 科学 中 群体 内 各 个 体 指 标本 来 就 呈现 一 种 纷乱 
的 态势 ,没有 单 值 的 关系 存在 . 这 意思 大 致 仍 可 回归 至 前 面 曾 论述 
过 的 ”观测 数据 "(误差 ) 与 ”统计 数据 "之 则 的 差异 ( 见 第 五 章 }). 在 
精确 科学 中 , 单 伪 的 关系 是 其 本 质 , 不 过 由 于 测量 误差 的 存在 使 这 
和 神 关 系 混 冲 "了 .在 摘 述 科学 中 ,这 种 混 痢 就 是 其 本 质 所 在 ,一 个 
单 值 关系 和 的 意义 有 多 大 就 成 问题 了 . 这 种 看 法 不 能 说 全 不 合理 , 癌 
题 在 于 给 回归 函数 一 个 恰如其分 的 解释 . 

庶 和 未 进 与 约 尔 观点 的 分 歧 还 可 以 从 实际 的 角度 作 深 一 屋 的 考 
察 . 在 生物 体 中 , 量 的 关系 往往 没有 因果 意义 ,如 身高 与 有 时长 的 关 


系 之 类 . 在 那里 ,需要 的 是 用 一 个 量 ( 相 关系 数 ) 衡 量 指 标 癌 关联 的 
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程度 . 即 重点 在 于 相关 分 析 . 如 要 和 作 全 局 性 的 考察 , 则 须 四 到 分 布 
上 来 ;此 所 以 皮尔 逊 重视 分 布 的 络 由 .至 于 约 尔 ,他 的 兴趣 在 于 把 
这 套 方法 用 于 社会 经 济 问题 ,那里 变量 之 阿 的 关系 往往 有 估 采 性 ， 
而 重点 在 于 在 平均 的 层面 上 对 现象 进行 解释 和 预测 ,此 所 以 一 个 
单 值 的 关系 很 重要 . 换 名 话说, 约 尔 关 心 的 重点 是 回归 关系 而 不 是 
分 布 . 这 还 可 以 从 他 以 后 工作 的 重点 得 到 印证 . 1820 年 代 以 后 他 
开创 了 时 间 序 列 分 析 , 即 建立 在 把 这 一 套 方 法 用 到 有 “时 间 相 关 ” 
的 数据 分 析 上 ,其 中 的 重要 节目 是 自 回归 . 可 见 这 种 “在 混乱 中 奸 
羡 关 系 "一 直 是 他 关注 的 主要 之 氮 - 

约 尔 早期 关于 相关 回归 的 著作 ,有 一 部 分 是 紧密 结合 社会 经 
济 问 题 的 分 析 , 如 贫困 问题 , 理论 性 著作 重要 的 有 #k 相 关 论 }, 发 表 
于 1897 年 ,其 主要 之 点 是 上 文 已 交代 的 与 最 小 二 乘法 的 结合 , 以 
玫 对 这 要 工具 来 取 一 种 旺 况 三 的 观点 , 即 由 奴 针 对 生物 学 拓 广 到 
面向 社会 经 济 间 题 , 此 文中 还 引进 了 偏 相 关系 数 与 复 相 关系 数 . 前 
者 他 称 为 " 浪 相 关系 狂 ””Cnet coefficient of correlation) ,证 者 他 称 
为 " 重 相 关系 站 "tcoefficient of double correlation). 男 一 往 信 得 注 
意 欧 论文 是 4 用 新 记号 系统 处 理 的 多 变量 相关 理论 》, 发 表 于 1907 
年 * 其 中 引进 了 一 要 新 的 多 元 相关 回归 分 析 记 号 .在 以 后 几 十 年 中 
钾 玫 为 标准 . 此 前 由 于 记号 的 混乱 和 兽 引 起 不 少 误解 ,并 在 一 定 程 度 
上 骨 三 了 方法 的 普及 应 用 . 

总 之 ,皮尔 进 在 数学 上 给 这 套 工 具 作 了 一 个 清晰 的 整 进 并 推 
广 了 其 在 生物 学 中 的 应 用 , 约 尔 则 解除 了 皮尔 避 所 加 的 “分 布 约 
束 ” ,阐明 了 与 最 小 二 乘法 的 关系 并 将 其 应 用 哲 广 到 社会 径 济 领 
域 , 这 样 络 相 关 回 归 的 创始 阶段 划 上 了 一 个 图 满 的 句 导 . 尔后 的 发 
展 驻 上 了 一 个 台阶 ,其 主角 是 费 软 和 甩 ,方向 则 是 小 样本 . 这 个 内 容 
将 留 作 下 一 章 的 主题 ， 
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第 八 章 ”小样 本: 
统计 学 的 新 台阶 


无 大 不 成 小 . 有 小 样本 吃 必 有 大 样本 .但 在 数理 统计 学 史上 ， 
是 "小 样本 "理论, 方法) 出 现在 后 ,命名 却 在 豚 ; 相 上 肥 ,“ 大 样本 ”出 
现在 前 ,命名 却 在 后 . 原因 在 于 :在 20 世纪 都 以 前 ,或 更 具体 说 在 
1908 年 以 前 ;统计 学 的 主要 用 武之 地 先是 社会 统计 (尤其 是 人 呈 
统计 问题, 后 来 加 人 生 牺 统计 问题 .在 这 些 问 题 中 的 数据 一 般 都 
是 六 量 的 、 旦 然 采 集 的 .所 用 的 方 旋 ,以 拉 普 拉 斯 中 心 瓜 限定 理 为 
依据 :总 是 归 顷 到 正 态 . 说 得 过 其 一 上 总 ,一 句 话 :统计 问题 自然 就 是 
大 样本 的 .不 须 命 名 .这 种 统计 学 的 项 暗 和 挥 阵 太 将 ,就 是 卡尔 。 
皮尔 带 . 
到 20 世纪 , 受 人 工控 制 的 试验 条 件 下 所 得 数据 的 统计 分 析 问 
赔 . 日 辣 引 人 注意 . 由 于 试验 数据 量 一 般 不 天, 那 种 依赖 于 近似 正 
丛 分 布 的 传统 方法 ,开始 招致 疑问 ,并 促使 人 们 研究 这 种 情况 下 正 
确 的 统计 方法 的 问题 . 这 个 方向 上 的 先驱 是 本色 特 CW. S. 
Gosset) ,主力 是 费 歌 尔 , 他 们 的 主要 建树 将 在 下 面 介绍 . 
本 前 讨论 的 内 容 , 属 于 小 样本 (理论 ;方法 ) 的 一 个 狭义 的 理 
解 , 即 涉及 求 统 计量 的 精确 分 布 问题 . 更 一 般 的 理解 是 ;任何 一 个 
统计 方法 ,如 果 它 在 定义 中 未 涉及 要 求 样 本 量 -ce 的 成 分 (如 利 
用 统计 量 的 被 了 根 分 布 来 确定 去 入 区 间 ) ,或 某 个 统计 方法 的 一 项 性 
质 其 定义 中 末 涉 及 要 求 co , 则 这 一 方法 和 性 质 是 小 样本 的 . 照 


这 样 说 ,分 界线 在 于 nn 阅 吕 与 吾 而 非 n 的 具体 大 小 .不 过 在 “小 样 
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本 ”这 个 名 词 建 立 之 初 ,这 个 “小 ” 字 还 是 按 其 字面 意义 理解 的 . 但 
究 竞 要 多 小 才能 算 “ 小 ”, 统 计 学 家 也 心中 无 数 ( 对 许多 统计 问题 ， 
今日 的 统计 学 家 也 还 是 心中 无 数 ). 哥 色 特 1908 年 的 开山 之 作 , 就 
是 要 在 一 个 特定 的 问题 中 把 这 个 大 小 的 界限 划 清 楚 . 

20 世纪 前 30 年 ,确定 正 态 样本 统计 量 精确 分 布 的 工作 取得 
了 长 足 的 进展 ,一 时 情况 极为 乐观 . 不 过 经 过 这 轮 工作 也 看 出 , 正 
态 以 外 的 情况 断 不 可 能 有 可 比 的 进展 ,而 随 着 统计 应 用 面 的 拓展 ， 
人 们 也 傅 来 剑 不 可 能 老 株 守 在 这 -个 模型 上 . 于 是 没有 办 法 只 好 
故 传 重 弹 ,把 当年 那 一 套 依 赖 正 态 逼 近 的 方法 再 拿 出 来 ,以 备 不 时 
之 需 . 这 时 大 样本 方法 就 不 一 定 是 针对 “大 "样本 了 ,而 往往 成 了 一 
个 身 不 由 己 的 选择 . 这 不 是 说 白话 . 现今 在 实际 中 使 用 的 大 样本 方 
法 为 数 众多 ,如果 去 问 一 位 统计 专家 , 某 法 需要 多 少 样 本 才能 放心 
使 用 ,多 半 得 不 到 明确 的 答复 ,因为 在 多 数 情况 下 谁 也 不 清楚 . 但 
其 中 一 些 常 用 方法 ,经 过 长 久 使 用 ,人 和 们 也 积累 了 一 些 经 验 ,可 以 
作为 参考 . z 

这 样 经 过 一 番 “ 和 否定 之 否定 ,我们 又 有 了 大 料 本 统计 , 面 这 次 
是 在 n 一 "的 意义 上 . 由 哥 色 特 , 费 融 尔 为 主将 搬 起 的 这 场 “小 样 
本 革命 ”, 看 米 其 净 效果 是 大 大 提升 了 正 态 分 布 在 统计 学 中 的 地 
位 ,并 把 那些 原本 不 需要 用 皮尔 孙武 天 样本 方法 处 理 的 问题 分 离 
出 来 ,可 并 未 能 取代 大 样本 . 相反 ,大 样本 方法 的 地 位 .从 近 50 年 
发 展 情况 看 ,只 能 说 是 强化 了 . 这 一 则 是 实际 的 需要 ,一 则 是 理论 
手段 加 强 提 供 的 可 能 性 , 即 近 几 十 年 来 概率 极限 理论 的 巨大 发 展 . 

这 个 发 展 还 产生 了 一 个 后 困 , 即 数理 统计 学 理论 研究 中 脱离 
应 用 实际 倾向 的 增加 . 虽 不 好 作 绝 对 的 比较 ,可 以 说 ,一 般 讲 小 样 
本 性 质 的 问题 往往 较 难 ,许多 甚至 无 解 . 例如 据 瓦 尔 德 的 “统计 决 
策 理论 "所 提供 的 许多 优良 性 准则 下 的 最 优 解 ,有 的 不 存在 ,有 的 
只 在 很 简单 的 情况 下 才 好 着 手 . 而 大 样本 理论 因 涉 及 取 极 限 ,总 的 
赔 问 题 好 着 手 一 些 --- 当然 ,也 不 是 说 都 很 好 解决 .于 是 几 十 年 
来 ,属于 大 样本 性 质 的 研究 论文 旦 指数 增加 ,其 中 多 数 是 既 毫 无 实 

8#3 


用 意义 ,表述 上 又 繁 秽 星 涩 ,缺乏 数学 美 . 这 种 现象 已 引起 国际 上 
一 些 知 名 统计 学 家 的 忧虑 ,并 针对 此 提出 了 一 些 对 策 . 

本 章 的 是 的 有 了 上限: 一 是 有 关 相 关 回 好 分 析 中 一 些 重要 的 统计 
量 , 其 精确 分 布 的 发 展 的 历史 情况 . 这 个 内 容 可 禄 为 上 一 章 内 容 的 
继续 :一 是 筑 计 学 中 两 个 很 重要 的 分 布 +t 分布 和 下 分 布 产 生 
的 历史 情况 . 至于 舅 一 个 重要 分 布 入 分布; 则 此 前 已 从 好 几 
个 途径 引进 过 丁 , 如 它 是 诺尔 人 进 3 型 分 布 、 皮 渗 蒂 在 求 线 性 模型 最 
小 二 各 估计 残 差 平 方 和 的 分 布 时 也 导出 过 它 . 历史 上 最 时 引进 这 
个 分 布 的 是 物理 学 家 马克 斯 威 尔 . 他 先导 出 气体 分 子 运 动 速 度 在 
一 个 轴 上 的 投影 服从 正 态 分 布 ( 拘 值 0) ,然后 在 3 个 ( 正 变 ) 轴 上 
速度 投影 独立 的 前 提 王 ,证 明了 速度 wv 的 模 的 平方 必 * 服从 自 
由 度 3 的 关 分 布 ( 略 去 一 蒋 数 因子 不 计 ), 在 2 维 情况 ,这 个 分 布 
电 曾 以 向 平面 轰 射 击 时 厦 弹 点 与 靶 心 距离 平方 的 分 布 而 导出 过 . 
稍 晚 些 , 物 理学 家 波 尔 获 意 曾 在 1878 年 和 1881 年 分 别 引 进 过 2 
维和 一般 ata 不 必 为 整数 ) 维 的 巡 分 布 .记分 布 在 统计 数据 分 析 
中 最 初 的 重要 应 用 ,当然 是 卡尔 ， 皮 尔 导 1900 年 的 六 所 合 人 柜 度 
检验 ,这 将 在 于 章 中 网 谈 . 


$8.1 哥 色 特 和 + 上 上 分布 ” 


哥 估 特 , 其 笔名 Student 比 他 的 真名 更 为 人 所 郑 . 床 紧 曾 指 
出 ,许多 统计 学 家 在 哥 色 特 于 1937 年 去 世 后 , 尚 不 知 他 就 是 Stu- 
dent. 因此 我 们 也 从 座 ,在 下 文中 用 Student 来 称呼 他 . 

可 人 芭 特 1876 年 出 生 于 其 特 伯 和 .他 曾 在 温 彻 斯 特大 学 和 牛津 


一 


早期 统计 立 献 习 懂 用 ”Student 分 布 " 这 个 称呼 . 用 :表示 Student 的 统计 明 , 云 
概 娘 于 1924 年 费 歌 尔 的 立 音 . 
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大 学 就 读 . 1899 年 作为 一 名 酸 酒 师 进 人 爱尔兰 的 都 柏林 一 家 啤酒 
矿工 作 , 在 那里 他 涉及 到 有 关 酿 造 过程 的 数据 处 理 呵 题 . 1906 到 
1907 年 他 有 1 年 的 时 间 去 皮尔 避 那 里 学 习 和 研究 统计 学 . 他 者 和 蛋 
关心 的 是 由 作为 试验 下 所 得 的 少量 数据 的 统计 分 析 滞 题 ,在 当时 
这 是 一 个 全 新 的 课题 . 因为 如 前 面 曾 指出 的 ,当时 统计 学 中 占 主导 
地 位 的 卡尔 皮尔 进 学 派 强 调 的 是 由 自然 观察 得 来 的 大量 数据 的 
统计 处 理 . 

这 一 研究 的 上 成果, 就 是 硼 面 曾 笋 钦 提 到 过 的 那 篇 使 他 名 垂 统 
计 史 册 的 论文 均值 的 或 然 误 差 江 以 下 简称 & 均 3 ,发表 于 1908 年 
的 《生物 计量 茶 志 上 . 如 现在 所 周知 的 ,他 在 该 文中 提出 了 如 下 
的 结果 ; 设 x ,… ,x 是 抽 自 正 态 分 布 wiia:a) 的 随机 样本 ,wa 和 az 


都 末 知 , 沁 工 二 Sz,s Ei 一 了 | . 则 芯 荆 宅 一 2 服从 
(RO 1) 
日 由 度 为 nn 一 1 的 1 分布-) 
《 均 ) 文 一 开头 有 一 般 很 长 的 导言 ,说 明 他 考虑 这 个 问题 的 动 
因 , 大 略 是 :众所周知 , 当 样 本 量 很 大 时 ,基于 正 态 ( 即 认 盖 为 正 态 分 


布 一 一 本 书 作 者 注 ) 的 方法 是 可 信和 的 ,但 没有 人 很 清楚 地 告诉 过 我 
们 :样本 量 的 “大 "和 “小 ”的 界限 在 哪里 ,而 本 文 的 目的 是 定 出 这 样 


一 个 界限 . 人 


-及 峰 度 系数 为 3 十 0 三 53《 应 为 3 十 -57. 又 :1 的 标准 


差 为 V 各 二 节 . 我 们 要 记 住 Student 讨论 的 工 与 zw ,的 差别 ) ;计算 


了 在 Student 的 原文 中 ,他 设 2 二 0( 这 无 关 宏 骨 ). 他 的 :的 定义 中 ,分 坏 是 -而 非 
"一 1. 又 他 是 考 左 荆 的 公布 而 非 -和 三 的 分 布 .出 于 这 些 差 异 , 他 讨论 的 变量 二 是， 
变量 /1 除 以 只 一 ,与 现在 我 亿 带 易 的 + 分 布 形式 有 所 不 同 ,但 实质 当然 无 异 
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了 一 个 小 型 的 (三 的 ) 分 布 表 如 下 所 示 , 最 后 给 了 几 个 实用 例子 ， 


pF aa 
F 
ti 


J ca Ra | 


a 国 | | 


1 
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表 的 用 法 是 4 要 记 往 已 人 恨 天 总 悚 均值 为 0: 例如 设 关 一 了, 则 
P| eo. 6 | 一 0. 904 0. 最 末 一 列 是 就 n= 二 7? 的 情况 ,对 二 的 正确 
分 布 与 其 近似 的 正 态 分 布 的 比较 . 如 就 上 人 鲍 ,n 一 ?7 革 ， 


P| 工 <0. 6 的 正确 秆 为 0. 904 0. 但 车 近似 地 认为 三 ~NC0,7). 
则 这 个 概率 将 是 0. 943 ?5. 

这 张 表 的 历史 意 交 在于, 它 是 应 用 上 家 其 重要 的 上 分 布 的 第 
一 号 表 . 后 来 在 1917 年 Student 及 对 表 进 行 了 少许 扩充 . 了 于 当 
时 的 计算 条 件 及 +t 密度 积分 计算 的 复杂 性 , 表 中 的 结果 上 略 有 谍 差 . 
Student 上 自己 在 1923 年 接 验 了 这 两 个 表 , 辣 论说 “二 者 完全 不 行 ” 


(“both berfectly rotten”). 按 上 上 表 来 比较 几 个 值 , 算 已 信安 4)5 杠 
半 于 站 一 101， 


好 一 站 .3 人. 614 82, 正确 信 8. 614 51. 
a—=0.6:.0. 718 46， 正确 值 0. 718 35. 
a—=0. 9;:0. 804 23, 正确 值 0. 804 22. 


其 他 值 的 比较 相当 ;看 出 误差 只 在 10 ,于 应 用 毫 无 影响 . 今天 我 
们 商 对 这 张 表 , 考 虐 到 李 当 年 简陋 的 计算 条 件 生 Student 本 A 并 
非 学 数学 出 身 , 能 算出 有 这 种 精度 的 结果 ,可 以 设想 他 村 出 了 多 少 
精力 及 其 工作 态度 之 认真 ,因而 不 由 得 要 表示 兰 赏 . 

现在 我 们 来 讨论 一 下 t 均 》 文 的 核心 部 分 , 即 Student 是 如 何 
导出 他 的 分 布 的 .他 的 证 明 分 为 3 步 ; 


1 找 坟 的 分 布 . 作法 是 ; 先 算出 s: 的 偏 度 系 数 P= 


颖 度 系 数 8, 一 3 5 ,得 到 


2 p82 — 38.— 二 由 ， 
据 此 ,他 推断 ,“s* 9 分 布 可 望 能 拟 合 一 个 属于 皮尔 史 3 型 的 分 
布控 种 法 定 出 总 的 密度 为 


ze，(z0)，c0 为 常数 ， 


8 
【于 一 了 
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2° 证 明 z? 与 不 相关 . 这 通过 计算 相关 系数 容易 得 出 . 
3° 据 2 ,用 独立 变量 ? 商 的 密度 公式 算 Z 一 二 的 密 麻 . 由 于 


xs 的 密度 都 已 知悉 ,这 个 计算 不 难 . 

如 今 , 粗 通 概率 统计 的 人 也 能 指出 Student 推导 中 的 漏洞 之 
所 在 .最 早 广 意 到 这 个 问题 的 是 费 砍 秒 ,他 于 1912 年 网 他 的 一 位 
天 文学 家 老师 谈 到 这 个 向 题 . 后 者 正好 认识 Student ,因而 建议 费 
时 尔 直接 与 Student 联系 ,这 梓 就 开始 了 两 人 的 通信 和 及 长 村 二 十 
余年 的 友谊 .Student 开始 对 费 克 和 尔 的 论点 有 所 犹疑 并 名 为 此 事 
号 信和 与 卡尔 ， 皮尔 避 规 量 . 在 费 获 未 致 Student 的 第 3 封 信 中 他 
缩 出 了 完整 的 证 明 并 显然 马 司 Student 相信 .不 过 , 费 软 尔 的 证 明 
迟 至 1925 年 才 正 式 发 表 . 

这 个 插曲 的 一 个 重大 的 历史 后 果 是 , 费 点 尔 因 此 发 展 了 其 “nn 
维 几 人 柯 "的 方法 ,他 发 现 这 在 正 态 样本 统计 量 的 抽样 分 布 中 ,是 一 
个 机 有 力 的 方法 . 洛 用 这 个 方法 , 费 砍 尔 获 得 了 一 些 在 应 用 上 极 重 
雪 的 统计 量 的 精确 分 布 , 它 促 成 了 统计 学 的 "Mark ”阶段 的 加 
速 到 来 ,其 意义 十 分 重大 . 

凌 获 尔 的 "x 维和 反 何 ”法 就 是 把 样本 Cx ,… ,zx,) 看 成 n 维 殉 氏 
空间 R" 中 的 一 点 .这 点 落 在 一 个 元 区 域内 的 概率 就 是 分 布 的 概率 
元 . 如 在 本 例 , 要 求 x+ 与 :的 联合 分 布 ( 仍 设 总 体 均值 为 0), 则 要 
设法 找 出 在 R” 中 ,集合 

和 a 十 (1) 
荐 起 梯 一 个 形 狼 ,这 里 


二 一 WwW 天 天， 一 3 (Cx. 
在 "中 过 原点 与 饮 作 一 条 射线 OB,5 为 点 (TI ,… , 工 ), 图 3,1 


届 显然 ,在 当时 Student 必定 还 趟 明白 * 不 相关 ”与 * 凶 立 "不 是 一 同事 , 昌 热 在 这 
里 二 者 硒 巧 是 一 致 的 . 对 这 一 点 不 能 苛 责 于 他 - 大 家 如 卡尔 。 频 尔 进 ,甚至 到 1920 年 
代 对 此 尚未 明确 .《 柄 受 一 一 现代 梳 计 学 家 ;一 书 第 83 页 讲 了 一 段 与 此 有 关 的 故事 . 
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表示 xn 二 3 的 情况 ,图 中 的 上 是 厨 ,而 
P 是 样本 点 (rs). 过 时 点 作 
一 1 维 契 平面 与 DM 垂直 ,刚玉 点 位 
于 此 平面 上 以 型 为 中 心 , 届 六 一 MP 
为 半径 的 赵 球 面 上 , 赵 球 面 的 维 数 > 
一 2( 在 x= 二 3 时 ,此 超 球 面 为 图 中 的 图 
周 , 是 1 二 3 一 ?2 维 ). 

现 如 7 在 加 到 各 十 A736 内 变 北 ， 
则 其 区 域 相当 于 两 球面 之 间 的 体积 
元 ,其 体积 为 c. 区 -Am, 另外 二 在 所 图 8. 1 
到 5 十 250 内 变化 ,等 于 说 这 个 向 度 上 还 有 一 个 人 让 , 的 变化 幅度 . 
由 于 Cn 输 与 己 所 在 的 超 平 面 正 记 , 知 集合 (1 的 体积 元 为 

Cn “770 ， 

历 梓 本 密度 在 上 述 体 邦 元 内 (基本 上 1) 是 一 常数 ,此 因 


fa exp 


LS |= 9 EXD 
一 2| = 
2 1 一 | 


一 二 D0) 
| =。 | 11,; 

— | 中 exp| 60) 

此 号 上 述 体 积 元 表达 式 结 合 , 得 出 集合 忆 } 的 概率 元 有 囊 达 式 


Cc exp | 2 | 4 . rexp| | , 


一 Ce exp 


这 一 举证 明了 wnx 与 独立 ,前 者 有 正 态 分 布 Wo,es 而 后 者 
有 皮尔 地 3 珊 分 布 ese 中 ( 仍 以 二 作为 sz 的 定 光 ). 与 Student 
猜 到 的 完全 一 致 ， 

这 个 例 于 描述 的 费 歌 尔 的 “= 维 几 何 法 ”, 适 用 于 其 他 更 复杂 
的 情况 . 当然 ,在 其 他 情况 ,体积 元 的 寻求 复杂 得 多, 费 炊 尔 从 小 训 


练 出 来 的 几何 直观 帮 了 他 很 大 的 忙 ,例如 对 相关 系数 x 的 分 布 ,其 
分 斩 推 导 极 其 复杂 . 费 黄 尔 借 助 几何 直观 大 大 简化 了 推理 过 程 ,其 
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梗概 将 在 后 面 略 述 . 这 个 方法 的 男 一 个 突出 的 应 用 例子 ,是 1928 
年 维 夏 特 基 于 此 活 导 出 了 任意 维 正 态 样 本 全 体 二 阶 定 的 联合 分 布 
维 夏 特 分 布 . 
在 “最 小 二 筠 法 ”" 那 一 章 中 我 们 兽 提 到 , 早 在 1891 年 , 度 泽 藻 
妈 已 得 到 费 歌 尔 在 上 面 用 维 几 何 得 到 的 全 部 结果 ,不 过 他 使 用 
的 是 正 交 变换 加 上 富 立 叶 分 析 ( 特 征 了 是 数 ). 因此 ,实际 上 在 那 时 ， 
制作 分布 这 道 大 菜 的 原料 和 方法 都 已 完全 具备 ,只 是 没有 一 种 
荫 因 促使 大 去 作 而 已 .那么 ,为 什么 统计 史上 对 Student 工作 评 恒 
如 此 之 高 :而 应 译 带 等 的 工作 册 基 本 上 滤 汕 不 彰 昵 ?这 个 疝 题 上 须 
结合 当时 统计 界 的 状况 去 看 才能 理解 . 

首先 就 是 我 们 在 前 面 多 次 提 到 过 的 那个 “数据 结合 学 "(误差 
分 析 } 与 统计 学 的 分 离 问 题 . 这 使 皮 洋 带 等 的 工作 或 则 不 为 统计 学 
家 有 也 注 意 ; 或 则 昌 注 意 了 ;也 不 过 晨 作 为 一 个 纯 数 学 结果 看 ,不 会 
注意 到 它 在 统计 数据 分 析 中 有 何 意义 .因此 对 统计 学 家 而 言 ;Stu- 
dent 提出 的 辣 题 ,即便 只 从 数学 角度 看 ,也 是 一 个 新 间 题 . 

更 重要 的 是 Student 所 提问 题 的 实际 背景 , 即 他 首次 把 小 样 
村 问题 提 到 日 程 上 ,这 一 点 在 前 面 已 有 所 强调 .但 是 ;在 当时 及 其 
后 的 大 二 年 ,卡尔 。 皮 和 尔 吉 还 是 统计 界 的 第 对 权威 ,他 的 “Mark IT? 
统 讨 仍 是 当时 统计 界 的 主导 思想 , 故 一 开始 ,Student 和 费 歌 尔 的 
小 样本 工作 并 未 在 统计 界 找 到 多 少 知 音 . 费 台 乐 的 女儿 在 为 她 父 
亲 写 的 传记 中 国民 了 述 至 1920 年 代 都 期 费 软 尔 三 这 个 问题 上 的 
扳 立 处 境 , 以 至 他 在 1922 年 在 其 著名 论文 4 理论 统计 学 的 数学 基 
础 3 中 还 开 列 了 一 张 单子 ; 列 出 当时 已 有 的 很 少 几 种 小 样本 成 果 并 
提出 一 些 有 待 解决 的 问题 . 1922 年 文章 * 即 是 对 纯粹 数学 家 的 挑 
战 , 也 是 向 他 们 呼吁 给 予 帮 助 ” 

然而 , 随 孝 小 枉 本 理论 的 进度 ,其 重要 意 久 日 益 为 统计 春 所 理 
解 ,特别 是 + 分 布 的 意义 ;因为 这 个 分 布 以 后 镍 次 出 现在 一 些 重 要 
统 订 基 分 布 的 结果 中 ,于 是 Student 这 一 结果 的 行情 逐日 看 涨 , 导 
到 后 来 续 计 界 将 他 尊 为 小 祥 本 理论 的 开创 者 和 并 祖 . 从 Student 
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的 工作 的 意 兴 和 对 以 后 数理 统计 学 发 展 所 起 的 影 吓 来 看 ,应 该 说 
他 对 这 一 评价 是 当之无愧 的 . 

Student 在 20 人 殿 纪 前 三 十 余年 是 统计 界 的 活 财 大 物 . 他 的 成 
就 不 限于 * 均 3 文 . 同年 他 发 表 了 在 总 体 相 关系 数 为 0 时 ,二 元 正 态 
样本 相关 系数 的 精确 分 布 , 这 是 关于 正 态 样 本 相关 系数 的 第 1 个 
小 样本 铺 果 .他 对 匣 归 和 试验 设计 方面 也 有 相当 的 研究 ,在 与 费 葡 
尔 的 通信 中 时 常 讨论 到 这 些 问 题 . 费 歌 尔 很 尊重 他 的 意见 , 常 把 自 
己 上 作 的 抽 印 本 送 给 Student 请 他 指教 .在 当时 ,能 受到 费 歇 尔 如 
此 看 得 的 学 者 为 数 椒 多 . 

3tudent 还 有 一 个 优良 品质 ,对 当时 英国 统计 学 的 发 展 起 了 
有 益 的 影响 . 他 是 一 个 性 格 温 和 ,易于 与 人 合作 的 说 说 君子 . 从 所 
局 车, 当时 英国 统计 界 几 位 领 水 的 夫人 人 物 之 间 名 有 人 分歧 以 至 个 人 
成 见 . 这 相当 大 的 程度 上 固然 与 学 术 观 点 上 的 分 歧 有 关 , 但 也 不 无 
个 人 性格 的 因素 .惟有 Stwudent -- 直 与 各 方 都 保持 良好 的 关系 .有 
这 样 一 个 例子 ;在 大 学 学 院 有 一 个 非 正 式 的 “生物 计量 学 俱乐部 ”. 
1922 年 费 歌 尔 想 把 它 扩 建 为 一 个 正式 的 学 会 ;他 了 解 到 此 事 没 有 
FE 尔 * 皮尔 还 发 起 不 行 ,而 他 是 皮尔 担 “最 后 一 个 听取 其 意见 的 
人 ”不 得 已 托 Student 向 皮尔 进 说 情 . 事 虽 未 成 , 颇 能 看 出 这 三 位 
大 家 之 间 的 关系 , 后 来 这 个 计划 直到 1943 年 才 以 建立 “国际 生物 
计量 学 会 ”而 实现 ,其 时 距 卡 尔 ， 皮 和 尔 提 逝世 已 有 7 年 . 

Student 与 盆 设 检验 理论 创始 人 论 曼 和 爱 根 。 皮 尔 示 都 保持 
只 好 的 关系 .发 醒 受 一 一 现代 统计 学 家 } 一 书 中 提 到 率 友子 1925 年 
官 到 伦 训 去 大 学 学 院 拷 卡尔 。 皮 尔 逊 未 通 ,Student 给 他 帮助 的 
情景 . 夺 曼 与 费 歌 尔 初 次 见面 也 是 由 Student 居间 介绍 . 对 爱 根 。 
应 尔 各, 他 当然 时 就 认识 ,因为 他 是 卡尔 。 皮 尔 各 的 朋友 .Student 
不 住 在 伦敦 ,但 与 爱 根 保持 通信 和 联系, 爱 根 在 自已 的 回忆 文章 中 ， 
提 到 Student 信和 中 阅 发 的 一 些 思 想 , 对 他 日 后 与 奈 癌 合作 建立 其 
慨 设 检验 理论 有 着 启发 性 的 影响 . 他 说 5 引 自 & 醒 曼 一 一 现代 统计 
党 家 》): 
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“我 认为 现在 统计 学 界 中 有 非常 密 的 成 就 都 应 归功 于 Stu- 
dent 我 想 引 起 作 们 对 他 ,对 他 注 章 实际 的 作 凡 和 研究 方法 的 
简明 性 的 注意 . 他 一 生 大 部 分 的 活动 上 只 是 简单 地 与 他 同时 人 的 数 
理 统 计 学 家 接触 ,通信 或 个 别 聚会 ,以致 人 人 V 们 入 容 易 扰 视 他 . " 爱 籽 
因为 Student 去 世 “" 在 情绪 上 深 受 影响 ”; 他 感 划 Student 往 许 多 
方面 对 人 自己 的 统计 学 理论 的 形成 所 起 的 作用 与 达 昌 一 样 多 ， 


3 8.2 费 克 尔 及 其 相关 系数 分 布 


这 个 工作 发 表 于 1915 年 ,在 他 的 文集 中 按时 序 第 4, 是 他 早 
期 的 成 名 之 作 . 

费 葡 尔 的 工作 , 量 多 质 高 面 广 ,许多 文章 都 是 开辟 了 一 个 新 的 
妍 究 领 域 . 本 章 及 以 下 几 童 将 有 机 会 介绍 地 的 一 些 重 要 工作 . 下面 
持 酷 述 其 生平 . 

罗 纳 尔 和 好， 费 和 车 示 (Ronald Avylmer Fisher ,1890 一 19623 生 于 
伦敦 . 少时 对 天 文学 和 数学 感 兴趣 .1909 年 人 剑 烽 大 学 攻读 数学 
和 物理 ,在 这 期 间 他 研读 了 卡尔 ， 皮 尔 刘 的 《数学 用 于 进化 论 》, 这 
将 他 引 和 疝 生 物 学 和 统计 学 .他 认 状 ,将 耿 乱 尔 的 学 说 与 生物 计 董 相 
缮 台 , 是 研究 人 类 过 传 学 的 正确 方法 ,这 使 他 对 优生 学 感 兴趣 . 后 
来 他 的 一 些 统 计 学 论文 就 发 表 在 忧 生 学 杂志 上 , 他 在 大 学 二 年 绒 
时 了 栈 对 辩 建 剑桥 大 学 优生 学 会 起 了 积极 作用 . 可 以 说 , 费 软 尔 研 究 
统计 尝 的 动力 是 为 服务 于 生物 学 的 研究 . 

他 无 疑 是 20 世纪 成 就 最 大 的 统计 学 家 ,是 20 其 纪 最 初 三 十 
余年 实现 的 ,由 以 卡尔 ， 皮 尔 进 为 代表 的 旧 统 计 学 ,朝向 以 他 为 代 
表 的 新 统计 学 的 转变 中 的 关键 人 物 . 关于 这 一 点 ,达到 传记 的 作者 
的 一 笑话 可 作为 印证 (译文 转 引 自 姚 菇 生 等 的 中 译本 { 灰 蝇 一 一 更 
代 统 计 学 家 ?第 88 页 》: 
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人 爱 根 ，) 皮 尔 进 业已 做 出 岂 定 ,如 果 他 和 终 帘 要 成 为 一 个 统计 
学 家 . 他 就 必须 与 他 父亲 的 思想 彻底 决裂 ,构造 已 自 己 的 统计 者 
学 . 在 回 已 录 中 ,他 把 他 当时 有 所 过 和 烧 的 事情 描绘 成 在 “马克 1 
CMark I) 统计 (他 用 来 称呼 卡尔 * 皮尔 提 的 统计 学 的 瞳 语 ,这 
种 统计 学 建筑 在 从 自然 总 体 中 获取 大 量 样 本 的 基础 上 ) 与 “马克 开 
CMark 了 ?统计 ”Student 与 费 葡 尔 的 统计 学 , 它 处 理 从 受 控 试验 
中 获取 的 小 样本 ) 之 间 的 “鸿沟 上 架 起 桥梁 ””. 

20 世纪 新 统计 学 之 区 别 于 19 世纪 旧 统 计 学 ;重视 小 样本 是 其 
一 个 标志 . 男 一 个 重要 标志 应 当 是 基础 理论 建设 , 即 从 学 科 全 局 的 
观点 建立 严整 的 数学 框架 ,而 不 是 停留 在 解决 一 个 一 个 的 具体 问题 
的 层面 上 . 在 这 两 方面 费 葡 尔 都 起 了 领头 的 作用 . 当然 ,起 过 重要 作 
用 的 还 有 一 些 六 ,如 这 曼 、 爱 衫 "皮尔 和 及 丽 尔 德 (Aa. Wald) 等. 

1912 年 费 葡 尔 发 表 了 题 为 关于 所 全 频率 曲线 的 一 个 绝对 浴 
则 ,这 是 他 的 第 1 篇 统计 学 论文 ,其 中 提出 了 咎 计 参 数 的 极 大 侯 然 
法 . 这 件 事 一 个 意 息 不 到 的 后 果 是 使 他 与 Student 发 生 了 联系 . Stu- 
dent 那 时 已 发 表 本 他 那 划时代 的 著作 《均值 的 或 然 误 差 》, 文中 的 证 
明 有 严重 的 不 是 之 处 5 见 前 文 ). 费 敬 尔 与 Student 通信 就 是 有 关 这 
个 问题 , 他 发 展 了 一 种 用 半 维 几何 来 处 理 抽样 分 布 的 技巧 ,取得 了 
很 太 的 成 功 , 特 别 是 解决 了 样本 相关 系数 的 确切 分 布 癌 题 . 

1914 年 爆发 了 大 成 . 费 葡 尔 也 打算 投 笔 从 式 , 但 央视 力 厅 好 
未 宁 ,使 他 感到 很 大 的 失望 .此 后 5 年 做 的 职业 是 中 学 教师 . 这 期 
问 他 音 生 了 一 种 思想 :农业 是 一 件 对 生活 有 意 多 并 可 对 国家 作出 
页 献 的 工作 ,为 此 做 曾 在 一 个 短 时 期 内 和 经营 过 一 个 小 型 农场 . 很 可 
能 是 这 种 思想 基础 使 他 在 1919 年 乐于 接受 达尔 文 一 位 亲 威 的 介 

弛 ,进入 罗 瑟 姆 斯 特 农业 试验 站 工作 . 
这 是 费 歌 尔 一 生 的 一 个 重大 转折 点 ,也 是 统计 学 发 展 的 一 村 
草 太 转折 扣 , 在 那里 ,他 因为 农业 试验 上 的 需要 发 展 了 一 整套 试验 
肌 计 的 思想 ,包括 随机 化 .区 组 ,重复 .混杂 和 多 因素 试验 等 ,奠定 
了 数理 统计 学 中 有 极 大 实用 价值 的 分 支 “ 试 验 设计 ”, 并 从 理论 上 
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昔 定 了 分 析 这 种 实验 数据 的 方法 一 一 万 郑 分 析 法 的 基础 . 他 在 那 
里 工作 了 十 余年 ,站 到 1933 年 困 卡 尔 "皮尔 进退 体 而 去 伦 贰 大 学 
党 院 接替 皮尔 各 担任 高 尔 登 佐 生 学 讲座 教授 . 这 十 余年 是 咒 砍 和 尔 
统计 学 生涯 的 全 盛 时 期 ,他 的 大 部 分 重要 的 研究 成 果 都 产生 计 这 
个 时 期 . 1943 年 他 转 企 便桥 大 学 巴尔 福 讲 座 教 授 ( 遗 传 学 )， 直 至 
1957 年 退休 . 退休 后 的 见 年 他 曾 去 印度 .美国 .新西兰 和 省 太 利 亚 
等 国 作 学 术 访 问 和 工作 .1962 年 病逝 于 澳大利亚 南方 沿海 城市 阿 
德 莱 德 ( 在 墨尔本 西北 方 ) ;终年 72 册 . 

他 的 善 作 ,论文 编 和 人 5 着 本 4 费 欢 尔 文 集 } 的 有 294 箭 ( 包 括 遗 传 
学 方面 的 论文 ) ,专著 有 6 种 . 专著 中 对 统计 异 影响 最 大 的 ,一 是 f《 研 容 
工作 者 用 的 统计 方法 ,初版 于 1925 年 ,以 后 再 版 13 次 . 另 一 是 & 试 
验 设计 》, 初 版 1935 年 ,再 版 7 次 . 又 他 与 其 合作 者 和 学 生 了 叶 艾 (下 ， 
Yates? 合 普 的 * 生 物 农 业 医 学 生 究 中 的 统计 用 表 》, 初版 1938 年 ,也 
是 重要 的 经 典 著 作 , 以 上 这 些 著 作 都 被 译 成 儿 种 文字 出 版 . 

费 葡 外 在 1929 年 当选 为 英国 皇家 学 会 会 员 ,1952 年 被 授予 

时 士 称号 、 


费 歌 尔 之 所 以 对 相关 系数 分 布 问题 感 兴趣 ,大 概 有 两 个 动因 。. 
其 一 是 Student 解决 了 总 体 相 关系 数 一 0 的 情况 下 ,样本 相关 系 
数 的 分 布 ,时间 是 1908 年 . 男 一 个 动因 来 自 皮尔 进 学 派 . 自 


1897 年 皮尔 避 得 出 > 的 标准 差 公式 天 ,他 一 直 相信 ,对 很 大 


的 2 只 要 吕 不 很 接近 士 1,r 的 分 布 近似 地 是 正 态 . 裕 帖 在 1913 年 
上 发 表 了 一 痛 题 为 4 相关 系数 或 然 误 差 的 2 阶 通 近 }》, 想 对 比较 粗粮 
的 公式 有 所 改善 . 后 来 的 研究 表明 , 沿 着 这 个 路 线 不 会 得 出 有 实际 
意义 的 结果 . 这 是 由 于 ,虽说 从 理论 上 可 以 证 明 : 当 mece 娃 > 的 
分 布 新 近 计 正 态 了 ,但 收 伍 得 裤 慢 ,以 至 于 如 肯 德 尔 等 在 其 k 高 等 

们 这 是 因为 ,> 是 样 让 矩 的 连续 可 徽 函 数 ,而 样本 矩 的 联合 分 布 渐 近 于 多 维 正 
态 . 
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统计 学 }》 中 所 指出 的 :在 4 二 500 时 使 用 全 二 全 之 类 的 渐 近 公式 是 


“不 聪明 的 ”这 个 问题 后 来 还 是 由 费时 尔 通 过 变换 将 > 的 分 布 “ 扶 
下 "为 正 态 求解 岂 ,但 眼下 他 的 问题 是 > 的 确切 分 布 问题 .他 显然 
受到 用 他 的 x 维 几 何 法 解决 Student 问题 成 功 的 鼓舞 ,相信 这 个 
方法 能 成 功 地 用 于 7 的 问题 .事实 确 也 如 此 ,据说 他 解决 这 个 复杂 
问题 只 用 了 一 周 的 时 间 . 

这 Cr yr Cr yy) 是 从 上 有 具 2 维 正 态 密 度 


一] 1 2 攻 
(2 ww 一 六 exp | ZI py 20Yy 十 如 


中 抽出 的 样本 . 此 处 假定 x、y 各 有 均值 0 方差 1, 这 不 影响 普遍 
性 ,因为 在 变换 

=artb: y=—=ecytd a0.c0) 
之 下 ,的 表述 式 匹 变化 (内 把 (Cc, yy,) 改 为 (x ,yy') 且 总 体 相 美 系 
数 也 不 变 . 在 这 密度 下 ,样本 {x30 .i 二 1,…n} 的 概率 元 为 


(ar VI-p) exp | — ge Sz2—2p dy Sy 
r=1 r 一 ] "一 1 


drdr dy dy,. (2) 
以 了 y 记 样 本 均值 ,r 记 样 本 相关 系数 ,而 


si 一 | D> Cx —2)) 7, 


一 | Dy 3) 7 
了 一 

可 Student 问题 枚 似 , 主 要 的 工作 是 要 找 出 当 (yysiysrssr)? 各 元 
各 目 在 

Cx TIA), [yy 十 向 说 [5 十 si，[ro sy 十 As ， 

Cr yr Ar] (3) 
内 变化 时 ,在 (rw 一 1 的 2 维 空 间 RR”" 中 对 说 的 元 区 域 
及 后 者 的 概 学 元 . 记 

Wi = 于)， Ws= (yy Oo yy). 
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作为 R" 中 的 问 量 ,其 夹 佣 4 的 余弦 cos8 二 r+. 问题 麻烦 之 处 在 于 ， 
此 关系 体现 在 R" 中 ,而 体积 元 要 在 R” 中 算 . 费 歌 和 尔 用 的 办 话 是 因 
是 (yy) ,把 一 切 计算 转 移 到 R" 中 来 .作法 如 图 8.2(a), 其 
中 点 大 为 (ZT TP 为 fr XT) ;而 点 全 则 是 (十 {yi 一)， 
十 Cy 一 y)). 这 样 ,向 量 MP 和 MT 的 夹 前 ,就 是 上 文 提 到 的 
W, 和 Ws 的 夹 角 5. 


图 8.2 


如 在 讨论 Student 问题 中 曾 指 出 的 ,更 在 点 已 只 能 在 一 个 
一 1 维 超 平面 中 的 球面 上 活动 ;此 球 和 的 中 心 为 MY 而 半径 为 5 ,而 若 
要 使 MP 与 4T 的 夹 角 保持 为 8 不 变 , 风 PP 点 被 进一步 限制 在 某 
个 mn 一 2 维 超 平面 中 的 球面 上 . 此 球 而 的 中 心 为 图 中 的 五 . 而 半径 
站 已 一 ssinl 一 s， YVI 一 天 .因此 , 当 有 一 个 as 的 改变 而 8 有 一 
个 好 的 改变 时 ,体积 元 应 与 
Gs lr As (sa0) 


成 比例 . 因 r= 二 cos8， sing = v 一 二, 故 上 式 可 用 


(2 ( 现 图 8. 2) 
来 取 人 和 从 . 再 配 上 了 空间 的 体积 元 5 在 Student 何 题 中 已 讨论 过 ) 
i 5 Ago J 及 工 的 变 北 x, 得 改变 的 体积 元 为 c 中 《Si1So 一 


〖《 一 本 


7 dsiqszdrdzdy. 再 注意 到 522? 式 中 的 函数 可 写 为 


局 从 副 度 论 的 观点 看 ,这 无 非 就 是 用 福 比 尼 定 理 来 计算 重 积分 . 
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cexp oe | : 


exp | 一 > 30 pI 一 22251389 十 3 | 


将 此 与 上 述 悼 积 元 策 人 台 , 锥 出 由 于 53) 的 变化 ,所 产生 的 概率 元 为 
人 Ar 下 ,其 中 


A={9x vl) ne exp | — 区 TC —2pI y+ ) dzay, 


B=r" Ge Texp | — so 2 gy ~ 2p] 12 3) bdssdszdr, 
号 式 中 的 常数 < 可 由 以 上 各 步 推导 中 涉及 的 常数 写 出 ,此 处 不 细 
述 . 

由 此 推出 , (x,y) 与 (s,s2o7) 独 立 ; 而 后 者 的 密度 就 是 BB 式 . 
对 5s1、sz 积分 即 禄 出 * 的 密度 ,可 用 积分 或 无 穷 级 数 表 出 ,具体 表 
达 陈 可 参看 有 关闭 作 ,此 处 不 必要 网 述 . 

此 例 比 Student 问题 更 移 人 以 天 维 几 合法 简 清 的 深刻 印象 
| 夭 一 不 恒 就 可 能 铸 成 大 错 . 

殊 尔 将 写成 的 文章 投 寄 到 由 卡尔 ， 皮尔 避 主 持 的 # 生 物 计 

最 ) 杂 志 续 站 发 表 于 该 杂志 1915 年 p. 507 一 521. 在 此 文 发 表 前 
后 一 段 期 间 , 费 . 皮 二 人 进行 了 一 些 通信 ,这 是 这 两 位 大 师 莱 系 较 
好 的 一 段 时 期 . 皮尔 进 表 示 对 费 融 尔 的 结果 很 感 兴 趣 , 但 他 感 兴 趣 
的 原 因 , 在 于 费 点 尔 的 结果 有 助 于 实现 亿 心 中 早 就 存在 的 那个 计 
划 , 即 就 样本 量 = 各 总 体 相关 系数 6 的 各 种 值 去 计算 r 的 密度 起 
数 , 作 出 其 图 形 ,计算 其 妨 度 与 蜂 度 等 一 一 当然 ,少不了 有 其 或 然 
误 起 . 做 这 个 的 目的 是 为 了 确定 :对 怎样 的 2 和 pp, 可 以 放心 地 反 ， 
的 分 布 近 做 地 当 作 正 态 分 布 来 处 理 .皮尔 避 兽 建议 费 歌 尔 自 己 也 
来 伟 这 一 工作 ,可 是 如 费时 和 尔 的 女 北 在 她 为 费 所 写 的 传记 中 指出 ， 
费 葡 尔 对 此 没有 兴趣 ,一 风 因 为 他 既 无 时 间 , 又 无 计算 机 器 及 助手 
( 费 获 尔 当 时 述 蚌 个 小 人 物 , 连 工 作 都 成 问题 ) ,不 像 皮尔 浊 那 样 令 
导 者 一 个 大 实验 室 . 而 县 ,更 重要 的 ,他 不 相信 这 一 作法 能 有 老少 
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成 效 ,“ 他 对 强 固 的 堡 浓 不 主力 攻 而 主管 取 ”*. 在 他 看 来 ,更 有 需 望 
的 做 活 是 鞍 过 变换 ,把 伺 新 的 > 分布" 扶正 ?到 正 态 上 来 . 
皮尔 提 璃 实 实 施 了 自己 的 计划 .他 动员 了 一 些 人 ,对 p= 

0.000.1)0.9 及 nn 二 3(1)25,50,75,100,400 计算 了 的 密度 . 他 在 
1916 年 5 月 13 日 给 费 歌 尔 和 的 信 中 ,对 结果 寡 示 失望 ,因为 即使 在 
2 一 400 这 么 大 的 样本 ,对 较 大 的 2 值 ,r 的 分 布 仍 与 正 态 相去 蕉 
下. 可 以 说 ;内需 而 的 意 关 上 皮尔 氨 这 一 研究 仍 是 有 所 收获 : 它 毕 
竟 以 明 上 无 误 的 证 据 显 示 了 ,在 此 问题 中 直接 用 传统 的 正 态 通 近 
方法 不 能 奏效 . 

相 到 , 费 点 和 尔 的 通过 变换 “转正 ?的 想法 , 取 是 了 了 极 大 的 成 功 ， 
结果 于 1921 年 以 4 小 样本 相关 系数 的 “或 然 误 差 ”}? 为 题 发 表 , 费 歇 
尔 在 此 文中 引进 了 如 今 周 知 的 变换 


[ 十 r 1 ite 
TI 一 r” 1 2 1 一 及 


=log 


而 证 明了 ;即使 不 太 大 (如 x 二 10),+ 的 分 布 仍 很 接近 于 正太 分 
布 ,其 均值 为 p 十 F57755" ,方差 为 (n 一 3)-1, 方差 为 一 常数 是 
一 极 好 的 性 质 . 下 面 的 图 8. 3 中 显示 了 变换 前 > 的 频率 曲线 , 品 示 


其 偏 斜 的 形态 ,以 及 变换 后 > 的 频率 曲线 被 扶正 的 情况 (图 8. 3 转 
引 自 充 近 美的 统计 学 数学 方法 好 .400 一 4017》， 


个， 均值 的 断 近 形态 显示 ,用 |ri1 帖 计 le| 可 能 系统 地 仿 低 . 当时 尚 不 知 o 的 无 偏 居 
计 , 无 法 对 此 验证 . 近 40 年 后 , 奥 靳 金 {I. Olkin}1958 年 得 出 呈 的 无 恼人 计 上 g(r) 二 


PC- ， 本 一 1.1 一 rr; 此 让 下 为 下 几何 星 数 
由 tt Tit i 
PF 站 时 中 = A TEE, 到 到 姬 也 
人 四 1 十 一 和 十 pe] 了 -| 


总 有 已 ( 于 ,二 ,全 一 11 一 c221, 圾 186rl> |rl. 
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(a) Cb) 
对 不 同 的 Pp, 样 于 相关 系数 7 的 频率 划 线 (样本 二 = 


右 :如一 号 日 


Lie) Kd) 


iog 了 的 频率 曲线 (样本 量 aa) 
右 :ms 


对 不 同 的 p,7 一 小 jog 
在 :站 一 1 
8. 3 
皮 泵 进 等 的 "合作 研究 ”文章 也 于 1916 年 以 & 和 相关 系数 的 小 样 


本 分 布 为 题 发 表 在 4 生物 计量 ?条 志 上 . 这 是 一 篇 86 页 的 大 文章 ， 
其 中 主要 是 图表 ,总 绪 了 皮尔 逊 等 的 计算 结果 . 


围绕 这 篇 文章 有 一 个 并 非 无 兆 紧 强 的 播 典 . 皮尔 各 在 些 文 哇 
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捕 进 了 一 段 , 托 评 费 睦 尔 在 其 1915 年 文章 中 使 用 了 由 时 斯 法 且 对 
2 用 了 一 个 错误 的 先 验 分 布 . 费 欧 尔 对 此 感到 二 停 并 于 其 前 引 
1921 年 交 章 中 对 此 进行 了 辨 驶 , 费 欧 和 尔 一 生 拟 对 贝 叶 斯 纺 , 他 对 
此 感到 和 不快 有 其 理由 . 现在 查看 费 砍 尔 1915 怎 文 章 , 也 看 趟 出 皮 
尔 避 的 批评 育 何 根据 . 不 过 , 费 感 尔 在 表述 上 ,例如 在 他 1912 年 引 
进 极 太 似 然 估 计 的 论文 中 ,也 确 留 有 若干 易 引 人 误解 之 处 . 

这 是 这 两 位 大 家 在 一 系列 统计 学 本 问题 上 观点 分 歧 的 一 个 侧 
子 . 更 早 些 ,在 1912 年 文章 中 , 费 软 尔 就 拖 评 过 皮尔 逊 的 此 估计 
法 . 两 人 人 分歧 最 著名 的 例子 ;是 在 带 未 知 参 数 时 皮尔 带 拟 合 优 度 统 
计量 的 自由 度 问 题 . 这 将 在 下 一 章 作 较 合 细 的 介绍 ， 

费 歇 和 汞 关于 了 精确 分 布 的 开创 性 工作 ,到 1920 年 伐 ,终于 引 
起 了 旨 多 学 者 的 注意 ,有 关 相 关 回 和 归 中 重要 统计 是 的 精确 分 布 ,在 
日 1922 年 起 的 十 余年 中 先后 效 得 了 解决 . 这 包括 儿 元 回归 系数 ， 
起 、 复 相关 系数 等 .到 1933 年 巴特 莱特 发 表 & 统 计 回 归 理 论 # 一 文 ， 
可 以 说 给 始 自 高 尔 登 的 古 瑟 加 妇 相 关 理 论 和 诊 法 的 发 展 , 划 了 一 
个 圆满 的 名 号. 此 中 的 过 程 和 细节 森 在 此 一 一 著述 ,只 搬出 凡 个 要 
点 : 

1. 回归 系 效 有 两 种 悄 沈 .一 种 情况 是 把 xz 值 ( 自 变量 值 ) 看 成 
无 随机 性 的 已 知 常数 , 这 个 场合 较 易 处 理 , 其 解决 笋 出 自 瘟 砍 尔 ， 
主要 在 其 1922 年 文章 # 回 归公 式 的 氢 合 优 度 及 回归 系数 的 分 布 》 
及 1925 年 文章 人 "Student ”分 布 的 应 用 } 中 ,其 解决 总 是 归结 到 
Student 的 上 分布. 顺便 指出 : 费 软 尔 在 上 述 1925 年 文章 中 ,时 出 
了 比较 两 个 正 访 分 布 均 慎 的 两 样本 £ 分 布 . 

2. 至 于 回归 系数 问题 的 另 一 种 情况 , 即 样 本 是 从 密 维 正 态 总 
体 中 抽出 的 因而 自 安 量 也 是 随机 . 对 这 种 情况 ;基本 的 问题 在 子 二 
阶 算 的 联合 分 布 . 当时 有 两 条 路 线 , 一 条 是 以 费 克 尔 为 代表 多 n 维 
几何 法 ,其 成 就 的 顶峰 是 1928 年 维 夏 特 (. Wishart) 导出 的 <“ 维 夏 
特 分 布 ” 后 者 是 整个 古典 密 元 分 析 的 基础 ,当时 的 重要 应 用 , 除 与 
相关 加 时 有 关 的 问题 外 ,还 宥 将 Student t 分 布 推广 旬 多 元 情况 的 
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十 泰 林 (H, Hotelling 7) 的 大 人 分布 18311 等 . 另 一 条 路 线 是 罗曼 族 
夫 斯 基 { WV.Romanovsky) 的 特征 肖 数 法 ,这 实际 上 土 是 皮 泽 蒂 方 法 
的 推广 , 这 个 方法 不 种 要 高 强 的 几何 直观 ,分 析 寺 处 理 较 复杂 些 伍 
是 按 步 就 班 的 . 现在 统计 学 著作 中 和 包 采 这 种 方法 . 

3. 也 特 莱 笠 的 主要 功 绕 在 于 把 一 些 结果 “Student 化 ”, 以 便 可 
直接 用 于 统计 推断 . 举 一 个 简单 例子 :对 2 维 正 态 总 体 N (a ,az ,51， 
122: 以 训 和 分 别 记 样 本 回归 系数 和 总 栖 回 妇 和 系数, 则 变 硬 

vn—l] > 
了 J i) {4) 
服 愉 :分 布 关 -由 于 mo 和 2 都 未 知 , 此 结果 无 法 直接 用 于 检验 
彤 的 假设 或 构造 其 置信 区 间 . 巴 特 鞠 特 证 明 : 若 在 (4) 式 中 分 别 以 
1 32 和 r 取代 alydzz 和 PP 天 将 v7 一 1 下 为 Yn 一 2, 则 所 得 变量 仍 
服从 分布, 但 自由 度 减 少 1, 为 n 一 2. 这 结果 已 可 直接 用 到 关于 月 
的 统计 推断 问题 中 去 . 


$ 8.3 费 软 尔 和 下 分布. 方差 分 析 


煞 理 统计 学 中 有 所 谓 “ 三 大 分 布 " 之 说 ,是 指 六 .+t 和 FT 这 3 
个 分 布 .此 说 之 由 来 是 办 为 它们 与 许多 重要 的 统计 推断 问题 有 关 . 
前 两 个 分 布 的 历史 缘由 在 过 去 已 有 所 介绍 . 这 里 我 们 来 讲 讲 下 分 
布 的 情况 ,这 还 联系 着 方差 分 析 的 早期 历史 ， 

20 世纪 前 20 年, 统计 掌 的 重点 仍 在 相关 加 好, 而 这 与 多 维 正 
态 密 芒 联系 着 ,由 这 也 突出 了 多 维 正 态 在 数理 统计 学 中 的 地 位 . 有 


忆 天 分 布 的 名 秩 是 新 内 的 克 (G. 三 . Snedecor) 在 1932 年 引进 的 ,入 侯 表彰 费 歌 
汶 的 荔 继 ， 费 台 尔 本 人 学 横 用书 -logF， 称 为 工分 布 ， 


ZF 


意思 的 是 ,这 三 太 丹 布 的 产生 都 与 锡 维 正 态 分 布 无 区, 相反 ,在 一 
定 意 尽 上 可 以 说, 它们 真正 的 根子 是 让 高 斯 线性 模型 一 一 好 在 
”二 x'P+e 中 视 工 为 非 随机 的 已 知 疝 量 那 种 线性 模型 . 

事实 上 , 分布 作 为 描述 统计 量 的 分 布 , 最 初 是 从 线性 模型 
最 小 二 涤 法 的 残 差 平方 和 和 分布 问题 导出 的 , 比 卡 尔 。 皮 尔 逊 的 x 
榨 验 星 . Student 的 {1 分布 加以 认为 是 与 线性 模型 > 一 8 十 e 联系 
看 ,e 服从 正 态 分 布 N(0,a*). 至 于 现在 我 们 要 济 到 的 下 分 布 , 则 
系 出 昌 遍 斯 线性 模型 中 变量 x 的 离散 化 . 

如 果 我 们 术 且 把 多 维 正 态 也 纳入 到 "线性 统计 模型 "这 个 太 体 
系 内 ;, 则 大致 可 以 说 ,这 个 体系 自 13 世纪 初 以 来 ,相当 大 程 床上 吉 
至 今日 ,始终 雄 据 子 数 理 统 计 学 的 要 津 . 其 发 展 大 致 可 分 为 3 个 阶 
上 段 :第 一 阶段 自 19 世纪 初 直 至 该 世纪 末尾 ,代表 人 物 有 高 斯 政 拉 
到 拉 斯 . 勒 让 德 等 入 ,形式 是 误差 论 并 逐渐 浴 和 作 到 统计 数据 分 析 问 
题 .第 二 阶段 从 19 世纪 末 到 20 世纪 20 年 代 初 期 ,代表 人 物 主 要 
是 卡 有 水， 上 度 尔 各, 形式 是 把 多 元 正 态 与 这 模型 联系 起 来 (这 是 由 于 
多 元 正 态 的 一 个 特殊 人 性质: 其 回归 为 线性 哩 条件 方差 保持 常数 )， 
章 扩 转 到 相关 回归 .第 三 阶段 可 以 说 始 自 1922 年 ,代表 和 作物 是 更 
葡 尔 ,形式 是 回复 到 以 自 变 量 为 非 随机 并 离散 人 礼 ,重点 问题 是 方差 
分 析 ( 协 方差 分 析 ) 并 联系 到 试验 设计 的 发 展 . 可 以 说 , 弄 清 了 这 个 
模型 发 展 的 脉络 ,也 就 大 体 上 懂得 了 自 19 世纪 初 以 来 统计 学 发 展 
的 主流 . 

骨 轩 到 玉 分 布 的 正题 . 这 个 问题 要 调 源 到 1917 年 斯 卢 黄 基 
.Siutrsky) 的 一 葡文 章 , 其 中 所 出 了 运用 皮尔 避 的 拟人 台 优 床 
(goodness of ft 思想 去 检验 回归 是 否 为 线性 的 问题 . 

采用 现在 通行 的 记号 ,斯 卢 落 基 的 原 假 设 可 写 为 如 下 的 模型 ; 

3 一 十 加 十 ea (5) 

其 中 sj 二 1 Wwf 一 1,", 此 } 全体 独立 ,en ，… ,ew 闻 分 布 且 有 

期 望 0 和 方差 oi. 这 里 容许 误差 方差 与 自 变量 取 值 zx 有 关 , 是 其 

一 特点 , 另 一 个 特点 是 在 一 个 自 变 量 值 zx; 处 重复 作 若 干 次 观察 ， 
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其 背景 是 :当时 盛行 考虑 分 组 数据 , 若 组 范围 足够 小 ,同一 组 内 数 
据 的 z 值 可 认为 即 是 组 的 中 心 所 在 . 另外 ,在 这 模型 中 自 变量 > 
并 无 随机 性 ,这 与 皮尔 吉 学 派 的 歌 法 不 同 . 

训 华 模型 55 成立 , 则 回 籽 y= 二 x 是 钱 考 . 斯 卢 获 基 的 想法 
是 :要 从 数据 出 发 去 构造 一 个 能 反映 与 这 个 假设 的 差距 的 量 . 斯 卢 
痰 茜 的 作法 若 下 ;算出 马 二 > 二 1 ,及 * 组 内 方 


Cl 


Dy 
六 "si 二 :用 加 权 最 小 二 来 法 
皮 


> ,wt 一 工 'B): 二 最 小 (6) 


确定 有 的 估计 及 . 计算 在 各 点 的 残 盖 mm 一 到 一 2 局 一 上 
斯 睛 省 基 认 为 ,在 原 假 设 5( 回 归 为 线性 ) 成 立时 ,统计 量 


将 服从 自由 度 海 的 六 分 布 .于 是 车 就 一 组 具体 样本 算出 之 值 
为 名 则 按 卡 尔 * 皮尔 提 1900 年 关于 拟 合 仿 度 检验 的 文章 ;数据 
与 {线性 ) 模 型 的 所 会 优 度 瘀 已 (如 之 名 1 当时 还 没有 检验 水 平 . 功 
效 一 类 的 概念 ). 

斯 户 医 基 这 个 论断 在 数学 上 是 不 正确 的 ,但 其 中 包含 了 一 种 
有 价值 的 统计 思想 :学 反映 与 模型 权 法 无 关 的 随机 误差 ,而 残 差 
:如 不 仅 与 随机 误差 有 关 ; 还 与 模型 取得 是 侍 正 确 有 关 , 模 型 与 
实际 偏离 鳃 大 ,7, 一般 也 会 愈 大 ,所 以 亏 这 个 量 反映 了 以 随机 误差 
水 平 为 标杆 去 衡量 模型 与 实际 的 偏离 程度 :此 量 愈 夫 , 模 型 与 数据 
的 蔡 合 看 上 去 愈 差 , 这 就 是 统计 量 上 的 实际 背景 ,这 个 思想 实际 上 
也 就 是 方差 分 析 的 精 体 . 这 是 一 个 例子 .说 明 在 评价 一 件 统 计 学 研 
究 工 作 时 ,首要 的 要 看 它 在 统计 是 想 和 方法 上 有 无 创新 . 数学 上 .的 
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正确 与 香 当 然 重要 ,但 仍 只 能 说 是 第 二 位 的 ， 

且说 费 敬 尔 抓 住 斯 户 奖 基 这 个 想法 ,但 在 数学 上 作 了 改进 , 首 
先 , 他 假定 误差 服从 正 态 分 布 且 方 差 只 一 对 不 依赖 2. 这 样 就 没 
有 必要 用 各 个 站 分 别 除 z 于 ,而 可 把 它们 折 超 来 ,得 到 一 个 总 的 
反映 模型 偏差 的 基 


目 
+ > 
上 >; 一 一 Te. 
7 一 1 


同样 ,为 估计 反映 随机 误差 水 平 的 量 ,可 以 把 各 个 5 结合 起 来 ， 
因而 引进 


对 Ca 在 人 研究 Student 上 分 布 中 已 证 明 它 有 颁布 只 ;其 中 衣 二 
zx 十 十 ro 对 局 1， 费 歌 尔 是 这 样 推理 的 : 它 是 避 个 基 的 平方 和 ， 
村 应 有 风 分 布 台 寻 . 但 由 于 ry yrs 要 到 户 个 约束 {tp 是 (5) 式 中 
她 的 维 数 ): 事 实 上 ,56) 式 的 加 权 最 小 二 溢 得 出 


是 Ey 
Dj ry 本 并 ) — Dj Wir 一 G7 一 lyr :PP. 
一 二 1 一 £5 


这 里 zi 一 (za 由 此 费 坎 尔 断 育 , 自 由 度 应 减少 pp; 即 
ci 有 分 布 下 丸 .…- 最 后 , 费 歌 尔 肯 定 G 与 G; 独立 . 他 这 一 点 的 论 
据 弃 足 :G, 只 与 yy,…,Y 有 闫 而 Gs 内 与 瑟 ,…' ,5 有 有关. 按 对 样本 
的 假定 ,yi (ys 独立 . 而 在 Student :分布 的 推导 中 已 
知 ”% 与 革 独 立 ， 

这 样 , 把 GG 和 GG; 分 别 除 以 其 自由 度 , 得 统计 重 

CG 一: 
好 一 点 


一 


ID 这 只 是 因 迁 就 数学 困难 涉 得 已 而 为 之 的 一 种 假定 , 失实 际 应 用 的 舶 度 看 ,应 访 


说 斯 户 获 基 原 素 的 假设 玩 合 表 . 可 惜 的 是 ,基于 这 种 般 设 的 方差 分 析 读 于 一 个 有 效 的 
小 样本 理论 ， 
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费 葡 尔 指 出 (在 原 假 设 成 立 之 下 ) 它 服从 皮尔 进 6 再 分布 ,现今 我 
们 通称 自由 度 交 避 一 pp,n 一 有 £) 的 下 分 布下. 但 费 黑 尔 习 惯 于 


考虑 Z 一 过 logQ@, 其 分 布 在 统计 上 称 为 Z 分 布 


有 了 这 个 分 布 就 本 以 按 皮 尔 于 的 方式 计算 氢 合 优 度 ; 帮 由 数据 
算得 久 一 ,, 则 概率 户 ( 放 ,这 Qo) 意 小 ,数据 与 模型 氛 合 愈 其， 

以 上 就 是 费 歌 尔 在 1922 年 发 表 的 论文 4 回归 会 式 的 拟 合 优 度 
上 及 加 归 系 数 的 分 布 》 一 文中 的 主要 内 容 . 其 所 以 把 回归 系数 分 布 与 
上 上述 内 容 合 在 一 篇 文章 中 ,原因 看 来 如 下 : 设 回 归 系 数 真 值 为 月 


而 其 (最 小 二 乘 ) 佑 计 值 为 有 ,偏差 8 一 8, 它 应 当 以 随 宙 误 差 为 标 
村 去 衡量 . 因为 此 处 是 在 模型 假定 为 正确 的 基础 上 去 讨论 ,页 随机 
误 郑 方差 怠 用 残 若 平方 各 (5 除 以 自由 订 ? 去 估计 , 取 其 比值 即 得 出 
上 分布 . 这 个 想法 直接 推广 到 检验 多 个 回归 系数 的 情况 . 要 注意 的 
是 ,这 里 的 自 变 痢 是 认为 非 随机 的 . 

纤 软 未 在 玄 章 中 对 品 分 在 的 论证 没有 多 着 笔 奥 ,看 来 他 基本 
上 仿 靠 直观 看 出 了 这 个 结果 , 即 在 由 他 所 首创 的 “自由 度 ” 这 个 重 
要 概念 上 . 这 个 概念 源 出 于 他 的 » 维 几 何 . 他 在 早期 与 Student 通 


信 讨 论 cx, 一 这 的 除数 应 蚌 nn 或 n 一 1tStudent 是 用 nn) 时 ,他 


主张 用 好 一 1 ;理由 其 定 了 工 司 ;点 CT 只 能 在 一 个 通过 点 
(rr) 的 2 一 1 维 超 平 区 上 活动 ,或 者 说 ,点 受到 一 个 约束 


cri 一 这) 一 0. 因 此 只 有 一 1 个 自由 度 .这 个 分 析 方 法 他 曾 多 


次 用 于 各 种 问题 . 实际 上 直到 现在 , 当 人 们 要 确定 某 个 二 次 型 统计 
量 的 正确 除数 时 ,自由 度 的 分 析 仍 是 一 个 便捷 的 方法 . 现在 我 们 在 
讨论 有 关 线 性 模型 的 理论 问题 时 ,经 常 采用 化 作 典 则 形式 的 方法 ， 
在 典 则 形式 下 ,自由 度 通 过 空间 维 数 的 变化 清晰 可 见 ， 
费 歌 汞 在 1922 年 这 篇 重要 论文 中 还 未 提出 方差 分 析 这 个 术 
证 ,但 已 很 接近 这 个 思想 . 两 年 后 的 1924 年 ,他 在 于 加 拿 大 多 伦 多 
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举行 的 国际 统计 学 会 大 会 上 , 作 了 题 为 ¢ 关 于 一 个 引出 车 干 局 知 统 
放量 的 误差 画 数 的 分 布 3 的 报告 ,正式 提出 了 方差 分 析 . 这 是 费 砍 
尔 惟一 的 一 篇 讨论 方差 分 析 的 理论 基础 的 数学 论文 ,也 是 第 一 篇 
出 现 “ 方 差分 析 表 ”的 数学 论文 ， 
方差 分 析 , 又 称 变 差分 析出 , 是 一 种 分 析 变 任 利 内 的 量化 靶 
术 ，, 举 一个 例子 : 合 中 国 全 体 国 营 企 事业 单位 的 职工 收入 来 说 ,这 
是 一 个 变异 很 大 的 量 ;不 同和 的 六 收入 各 不 同 且 着 借 其 大 . 社会 学 家 
力 至 一 艇 公众 部 会 对 产生 这 种 送 蜡 的 原因 感 兴趣 ,一般 定 性 式 的 
分 析 也 不 难 : 这 中 阅 有 地 区 .行业 ,教育 程度 ,年 龄 …… 种 种 因素 . 
可 是 如 提要 问 一 名 :这 些 因 素 各 起 的 作用 有 密 太 ?能 和 否 给 予 一 数量 
的 刻 划 ?这 喜 不 好 回 管 .方差 分 析 是 答 试 给 予 这 个 问题 一 种 回答 的 
统 计 分 析 技 术 . 安之 所 以 能 流行 开 , 是 办 为 在 一 定 模 型 的 基础 上 ， 
蕊 有 着 一 种 易于 操作 的 程式 ,以 及 坚实 的 概率 理论 基础 . 在 数学 上 
为 这 一 技术 更 定 基础 的 ,就 是 费 感 尔 的 上 述 工作 . 
严格 说 来 ,这 个 思想 不 是 始 自 慢 软 尔 , 早 在 19 世纪 已 有 统计 
学 者 接近 了 这 种 思想 .下文 要 谈 到 的 莱克 西 斯 就 是 其 中 之 一 ,但 
是 ,这 些 学 首 考 虑 网 模型 过 塞 ,没有 在 普遍 性 的 高 度 上 清晰 地 标明 
方法 县 缺乏 坚实 理论 基础 的 支持 ,因而 述 不 能 成 气候 ,这 和 多少 受到 
了 当时 概率 统计 水 平和 的 局 有限. 总 的 说 ,将 方差 分 析 这 个 重要 工具 的 
创始 粮 归 子 费 台 尔 是 恰当 的 . 
菜豆 两 斯 (WW. Lexis ,1837 一 1914) 是 德国 统计 学 家 兼 经 济 学 家 ， 
18539 年 毕业 于 波 办 大学. 起 初 他 的 专业 是 科学 和 数学 . 1861 年 他 去 
巴黎 学 习 社 会 科学 ,以 后 在 欧洲 一 些 大 学 蛙 殷 任 过 教 职 . 他 像 抽 特 这 
特 一 样 , 是 一 个 致力 于 杷 数学 方法 引进 到 社会 科学 研究 中 去 的 入 . 
在 1876 年 一 1879 年 期 间 他 转向 于 研究 “统计 序列 ”CStatisti- 
cal series) ,其 量 重 要 的 工作 ¢ 统 计 序 列 的 稳定 性 理论 $3 发 表 于 


中 答 际 上 费 赔 尔 最 早 提 出 的 概念 和 variation 应 译 为 * 挛 差 ". 现在 说 的 蕊 ( 变 差 ) 平 
方 和 ,fx 一 x)? 基 一 个 反映 数据 总 的 变化 府 的 量 , 它 并 非 那 一 个 随机 变量 之 方 问 的 估 
计 - 但" 变 荆 分 析 ” 这 个 术语 未 能 在 国内 统计 和 办 流行 开 . 
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1879 年 . 问题 的 背景 是 这 样 的 :; 设 考虑 一 个 国家 (或 一 城市 .一 民 
族 之 类 ?的 某 项 指标 ,例如 离婚 率 , 其 逐年 记录 为 了 …, .如果 
x 对 两 个 国家 A、B 对 此 项 指标 进行 比较 ,记录 得 两 个 序列 了 了 mw， 
YYsrt ys. 如何 根据 所 得 数据 去 判定 ;有 A,B 了 两 国 在 此 项 指标 
上 有 无 差异 ,差异 包 大 . 这 样 的 数据 列 了 4,…， 4 莱克 西 斯 称 为 
统计 序列 ,现今 我 们 称 为 时 间 序 列 . 
匠 克 西 斯 认为 ,要 进行 有 意 交 的 比较 ,统计 序列 必须 是 稳 征 
的 . 后 者 他 解释 为 ,序列 中 的 变化 纯粹 是 由 于 随机 性 的 原因 ,而 没 
有 系统 性 因素 起 作用 . 他 用 二 项 分 布 来 描述 这 个 意思 . 设 | ,…， 
Y, 是 一 串 独 立 观 察 值 ,六 服从 二 项 分 布 BCN,p,) (例如 ,NN 是 一 
国 已 燃 人 数 ,7 是 某 年 观察 到 的 离婚 人 人数, 站 是 该 年 理论 上 的 离 
嫩 率 ). 所 谓 统 计 序 列 了 ,,…,Y, 是 稳定 的 ,理论 上 解释 为 
Pl 二 p= = pp. (C7) 
问题 是 如 人 柯 判 别 稳 定性 之 有 无 . 药 克 西 斯 的 作法 如 下 ;: 先 引进 Cy 


2 
一) 
一 _ L 
R=ec{ OY C— FT)?, = 0.6745,( 下 同 ) 
+r—] 


作为 序列 变异 的 度量 , 乘 上 c 是 迎合 当时 喜 考 虑 或 然 误差 的 时 尚 . 
另 一 方 而 , 若 稳定 性 成 立 , 即 有 7) 式 , 则 序列 了 ,…, 的 意 异 纯 
是 由 于 问 一 个 二 项 分 布 BN , 思 ) 的 各 观察 值 之 间 的 变异 ,应 当 用 
| 如)“ 去 度量 . 由 于 pp 未 知 ,用 F' 去 估计 ,得 
FoF yi 
= 
它 是 作为 纯 由 随机 性 引起 的 变异 前 度量 ,可 以 把 它 和 方 盖 分 析 中 
的 “误差 平均 平方 和 ”来 比拟 . 
最 后 ,p;,…,p, 之 间 的 不 同 ( 变 异 ), 反 映 了 序列 变异 的 本 质 
成 分 . 这 个 变异 可 用 | 
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-| 
Tel =! 
{nC—1) 
来 度量 . 这 一 项 可 与 方差 分 析 中 的 “ 主 效 应 平均 平方 和 ”来 比拟 . 
莱克 西 斯 说 我 们 期 望 有 

R’=r: To. f 总] 
如 果真 是 这 样 , 则 (8) 式 宰 成 一 真正 意 疼 下 的 “ 变 差 分 析 ”". 可 是 此 
式 在 数学 上 不 成立 { 例 如 ,观察 全 了 :7 可 以 磁 巧 相 届 ,这 时 届 
二 0 面 79 不 为 0), 它 至 多 只 能 理解 为 在 实际 数据 中 经 常 能 大 至 
成 立 的 一 个 关系 .不 过 它 提供 的 思想 是 有 价值 的 . 前 面 我 们 就 提 
及 ,一 件 统计 工作 的 价值 ,首先 看 它 是 杏 提 供 了 新 思想 ,新 方法 . 


莱克 西 斯 引进 比 Q= 二 ,然后 指定 一 个 常数 4, 例如 4 一 V3， 


在 已 三 4, 视 "全 完 界 "RR 基 本 上 是 由 “随机 变异 ”所 提供 ,而 序列 
就 判 为 稳定 的 . 闭 包 宇 a, 则 判 为 不 稳定 和 的 ,这 也 与 后 来 方差 分 析 中 
的 所 检验 法 在 思想 上 上 一致 
更 有 意义 的 是 菜 克 本 斯 进一步 对 疡 的 变化 形式 引进 模型 , 例 
如 线性 模型 
pr =a Ol ns 
从 而 可 以 用 最 小 二 乘法 来 计算 p; 的 拟 合 值 疡 ,: 即 由 


D1 (Yi 一 “一 := 最 小 
解 出 a 一 2 .6 一 2 ,而 2》 ,一 2 十 3 ,, 这 时 他 证 明 有 下 述 分 解 式 
YF PF) py). 
这 已 是 数学 上 严格 的 分 解 式 , 即 我们 现今 在 初等 统计 教 本 中 习 见 
的 一 元 线 件 回归 方差 分 析 分 解 式 . 


不 好 估计 莱克 西 斯 的 工作 对 费 葡 尔 的 影响 得 座 如 何 ,但 费 归 


尔 是 了 解 这 个 工作 的 ,他 1925 年 出 版 的 专著 《研究 工作 者 用 的 统 
计 方 法 3 中 提 到 了 了 它 . 


08 


问 到 费 歌 尔 1924 年 的 论 立 . 此 立 就 其 内 容 说 是 一 篇 讨论 下 
分 布 存 种 种 检验 问题 中 的 应 用 的 交 章 ,其 中 有 检验 两 个 正六 方差 
是 香 相 等 的 方 着 比 检验 ,以 及 肯定 Student 上 分 布 如 的 平方 就 是 
,等 . 更 重要 的 是 明确 提出 方差 分 析 的 应 用 . 举 两 个 例子 . 

一 是 检验 若干 个 正 访 均值 是 否 相 等 的 问题 , 襟 型 是 :大 , ,…'， 
XN(Goro) to 与 1 无关) 一 1 一 一 起 个 变量 
(二 1 1 ,1 全体 独立 .问题 是 要 判明 假设 二 :a 


二 一 二 是否 成 立 . 接 当 时 流行 的 讲法 ,就 是 这 个 假设 与 数据 的 
“goodness of fit1 ”7 如何 ， 


费 点 尔 的 作法 是 算出 几 个 变 差 : 
上 . 5 
全 亦 着 >, 人 ， (ri ~ 了) 一 了 工 , 费 三 和 尔 称 之 汐 “Totajl variance”， 


E=1 j=1 


给 辣 变 差 Ds 一 -一 五 , 费 歌 尔 称 之 为 Between classes 


vATIANCEe ， 


组 内 变 差 之 之 (zu 一 去 一 克 , 费 歌 尔 称 之 为 Wifhin classes 
VArLAaNnce., 
这 单 x 和 志 分 别 是 全 部 zj 和 xas… ,zi 的 算术 平均 了 ,然后 列 出 方 
莽 分 析 表 ( 按 费 融 尔 原文 ,但 平方 和 用 BB,W 和 人 代替 ): 


方差 分 析 表 
恋 卷 利和 由 度 平方 和 均 方 
组 间 ed 一 大 一] a 和 
组 内 cs 一 点 5 -一 是 WwW $3 
恕 | 了 加 


当 财 的 时 尚 是 用 S 伐 昔 求 和 号 >， :也 不 喜 用 足 标 . 在 但 歌 汞 原文 中 了 家 为 
3SYf7 x); 有 的 连 起 沪 足 标 1.n 也 不 标 出 . 


2 村 


“ 均 方 "是 平方 和 除 以 自由 度 . 按 费 歌 尔 1922 年 文章 的 推理 ,在 候 
设 万 成 立时 , 圭 服 从 下 分 布 Fo 


费 葡 尔 在 这 里 假定 了 各 组 观测 值 个 数 相 同 , 这 个 条 件 基 非 实 
质 的 . 如 第 i 组 观测 个 数 鸭 n;, 则 只 须 在 计算 了 .BB 和 和 全 的 公式 中 
改 : 为 上 :并 把 自由 放 ds 改 汶 1 十 十 p24 一 二. 

费 砍 尔 文 章 中 另 一 个 例子 基本 上 是 1922 年 文章 的 重复 ,此 即 
一 个 加 吕方 各 的 所 合 优 度 问 题 . 他 也 烈 了 方差 分 析 表 ,其 中 变 差 平 
方 和 的 名 目 : 分 别 是 “组 均值 与 方程 的 偏离 ”与 “组 内 妨 离 ”. 其 自由 
度 .平方 和 的 表达 式 等 ,都 与 1922 年 文章 无 异 .一 个 新 的 因素 是 昔 
鞭 乐 担 到 操 归 方程 “不 论 是 直线 或 曲线 的 ”此 法 都 适用 . 这 里 就 要 
看 “曲线 ?的 意义 如 和 何 . 藻 像 多 项 式 yy 二 局 十 让 十 十 BB 这 类 情 
这 , 虽 则 不 是 工 的 线性 西数 ,但 下 对 系数 序 ,… :有 而 言 为 线性 ， 
财 费 歇 采 碾 说 正确 . 但 若 回归 方程 有 yy 一 员 e 十 房 之 类 的 形状 ， 
同 归 方 程 对 参数 刀 不 为 线性 :, 则 费 区 和 尔 所 说 不 正确 . 从 广 章 中 看 不 
出 费 歌 尔 真 意 上 所 在 . 依 作 者 猜测 以 后 一 种 可 能 性 居 儿 ,因为 有 其 他 
一 些 证 据 表 明 , 费 加 尔 对 他 的 方法 系 紧密 联系 于 高 斯 线性 模型 这 
个 基本 后, 似乎 不 是 特别 留意 的 . 

应 当 留 意 的 是 : 费 砍 尔 此 文 确实 葛 定 了 方差 分 析 的 一 般 框架 ， 
不 是 像 在 表面 上 看 那样 只 讨论 了 “一 种 方式 分 组 ”这 个 最 简单 的 情 
形 . 我 们 用 一 个 例子 可 以 墨 容易 说 明 这 一 点 . 设 有 “二 种 方式 秀 组 ?” 
数据 


点 ,一 人 十 有 十 ee 
他 "分 唱 是 A 两 因素 的 " 主 效 应 *. 这 要 检验 “A 
的 主 效应 不 存在 " 即 e 二 … 二 ar; 则 “组 闻 平 方 和 ”, 在 此 我 们 通称 


“44 的 主 效应 平方 和 ”, 其 计算 与 前 例 完全 一 样 . 不 同 的 是 现在 误差 
平方 和 与 上 例 的 组 内 平方 和 不 是 一 回 事 , 因 为 还 有 另 一 因素 8B 在， 
正确 的 算法 是 算 模 型 拟 合 的 残 差 平 方 和 > CX 一 2， 一 2 7 


elu 


2 由 ,由 最 小 二 乘法 定 出 . 费 葡 尔 在 虐 例 中 没有 盟 确 强调 ;该 例 中 
的 组 内 平方 和 就 是 误差 平方 和 ,但 细 读 他 在 1922 年 和 1924 年 的 
文章 ,看 来 他 心里 是 明白 这 一 点 的 . 

在 方差 分 析 实 用 的 层面 上 , 费 感 尔 当 时 在 罗 倒 姆 斯 特 农业 试 
验 站 积极 推行 田间 试验 ,1923 年 与 束 肯 齐 发 表 了 第 一 个 方差 分 析 
的 实用 酌 子 . 这 期 间 他 发 展 了 试验 设计 的 一 些 基 本 原则 ,其 1926 
年 文章 ¢ 农 业 试 验 的 安排 》 可 视 为 他 的 理论 的 一 个 大 纲 , 细 节 后 来 
写 进 1925 年 * 研 究 工 作者 用 的 统计 方法 》 与 4 试验 设计 》 两 本 专著 
中 . 到 20 年 代 末 为 止 ,试验 设计 中 许多 基本 机 素 ,请 如 交互 效应 、 
混杂 ,2 型 设计 之 类 的 东西 ,都 已 在 他 及 合作 者 的 工作 中 使 用 ,而 
分 析 这 些 数 据 角 方法 方 蔗 分 析 的 理论 基础 , 则 在 于 他 1924 年 
这 篇 著作 . 

当时 的 问题 不 是 出 在 方差 学 析 娃 论 之 不 足 上 ;而 是 出 在 设计 
上 . 黑 具 体 地 说 ,出 在 设计 的 正 交 往 上 . 如果 一 个 设计 中 全 有 和 包 个 
效应 ,所 有 .BO AB,AC,BC,.…, 辐 然 可 以 用 费 点 尔 1924 年 
文章 的 方法 计算 每 一 个 效应 的 平方 和 ,并 由 残 差 平方 和 算出 误差 
平方 和 ,但 这 些 平 方 和 加 起 来 是 否 等 于 总 变 差 平方 和 呢 ? 这 就 取决 
于 设计 有 无 正 交 性 了 .后 来 的 学 者 对 费 咒 尔 早 期 的 若干 方差 分 析 
实例 作 过 复 算 ,证 明 有 的 妇 不 起 来 ,在 这 种 情 沉 下 “方差 分 析 ” 就 失 
挥 了 上 忆 的 本 头 . 

不 能 哟 费 加 尔 不 了 解 正 交 性 在 方差 分 析 中 重要 柱 , 也 不 能 说 
他 在 实际 工作 中 没有 重视 这 个 局 题 . 据 有 的 学 者 分析 ,问题 出 在 他 
过 于 相信 直觉 和 的 正确 性 ,而 未 能 在 每 个 场合 都 在 线性 模型 航 提 法 
下 去 严格 验证 这 一 点 , 蕊 至 有 大 记 为 他 一 上 度 怖 向 于 采取 一 种 非 举 
怀 5Coordinate free) 的 观点 来 好 理 试验 设计 数据 的 分 析 问 题 . 

于 1930 年 代 , 这 种 有 些 混乱 的 局 面 开 始 得 到 改善 .统计 学 家 
十 水 在 其 (高 斯 线性 模型 的 历史 发 展 ) 一 交 中 有 一 段 话 , 很 好 地 撒 
述 了 那个 时 期 的 情况 , 转 引 如 下 : 

“第 一 个 坦率 承认 下 述 事实 , 即 一 个 用 最小 二 乘法 分 析 的 线性 
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模型 比 仅 依赖 直觉 去 分 析 平 方 和 更 为 基本 ,是 叶 芯 1933 年 的 文章 
ee 然而 ,即使 在 那里 ,线性 模型 中 自 变 量 值 的 问题 仍 未 得 到 强调 
….… 然 而 ,1 年 后 , 罗 瑟 姆 斯 特 的 工作 人 员 埃 和 尔 温 发 表 了 -篇 文 
章 :其 中 对 随机 区 组 和 拉丁 方 设计 给 了 -- 个 明显 的 向 量 标 示 , 清 楚 
地 指明 了 ,这 些 向 量 的 正 交 性 是 如 何 将 平方 和 分 解 为 一 些 给 成 部 
分 的 ” 

从 这 里 也 再 一 次 印证 了 线性 模型 的 极端 重要 性 . 其 至 试验 设 
计 也 是 建立 在 这 个 模型 的 基础 上 . 灰 曼 1966 年 在 美国 科学 促进 协 
会 年 会 上 的 演讲 中 ,以 费 软 尔 为 界 把 统计 史 分 成 描述 性 统计 与 分 
析 性 统计 两 个 时 期 . 如 果 这 个 说 法 是 正确 的 话 , 那 这 个 分 界 ,或 者 
说 费 歌 尔 的 历史 功绩 ,可 以 说 就 在 于 把 高 斯 线性 模型 从 一 个 局 限 
于 “数据 组 合 "的 工具 ,提升 到 统计 学 这 个 大 舞台 的 中 心地 位 ,并 把 
它 的 潜力 充分 地 挖掘 出 来 . 


第 九 革 ”假设 检验 


近代 意 必 下 的 假设 检 验 ,就 其 理论 体系 的 建立 来 说 , 始 于 奈 曼 
和 爱 根 ， 皮 尔 进 在 20 世纪 20 一 30 年 代 的 工作 . 就 其 实用 屋面 看 ， 
则 由 卡尔 ， 上 皮尔 进 和 费 歌 尔 两 位 太 师 所 主导 . 本 章 的 有 自 的 ,就 是 以 
这 几 位 太 师 的 工作 为 主线 ,考察 一 下 有 关 的 历史 发 展 情 沈 . 

当然 ;在 统计 学 中 提出 和 姓 理 假设 检验 问题 ,并 不 是 始 于 上 述 
请 人 .我 们 在 前 面 几 章 的 角 述 中 也 曾 点 到 若干 有 关 的 情 沉 ,如 阿布 
兹 语 特 等 人 关于 慎 儿 性 别 的 检验 ,莱克 西 斯 关于 统计 序列 的 稳定 
性 检验 等 . 遍 斯 正 棕 误差 理 论 流行 后 ;在 研究 者 中 习惯 计算 种 种 量 
的 或 然 误差 , 它 也 被 用 于 检验 有 关 正 态 均 值 的 假设 , 曙 然 问题 趟 一 
定 是 接 检 验 假 设 的 方式 提出 来 . 

考察 早期 党 者 进行 的 一 些 很 设 检验 ,我 们 会 看 出 :他 们 的 思路 
与 我 们 驱 在 的 思路 比较, 并 没有 实质 的 不 同 , 即 用 某 种 方式 去 定 匀 
数据 与 原 假 设 的 差异 . 差异 盖 大 , 则 原 假 设 人 总 不 可 信和 ,反之 则 优 可 
傍 . 但 由 于 当时 概率 统计 发 展 的 水 平 ,这 些 学 者 未 能 从 数量 的 高 庆 
去 刻 划 与 一 定 差 异 相 应 的 相依 程 度 .卡尔 ， 上 皮尔 避 的 报 合 优 度 与 
绢 葡 尔 的 显 者 性 水 平 的 提 法 ,在 许多 重要 的 检验 问题 中 做 到 了 这 
一 成, 因而 上 了 一 个 台阶 . 

度 尔 扣 和 各 费 欢 尔 工 作 的 不 中 之 村 ,在 于 他 们 都 是 以 “个 案 *” 的 
方式 来 处 理 检 验 问 题 . 每 有 了 一 个 有 竺 解决 的 检验 问题 ,就 用 直观 
的 想法 ,通过 设计 出 适当 的 反映 数据 与 假设 的 差异 的 量 ,其 一 个 基 
本 要 求 是 要 能 定 出 此 量 的 分 布 ,这 样 就 可 构造 出 一 个 检验 法 . 但 
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是 ,反映 数据 与 假设 之 差异 的 量 可 以 有 很 多 . 使 用 不 同 的 量 , 得 出 
的 检验 方法 也 不 一 样 . 如 何 制定 一 些 原 则 各 标准 ,以 对 此 众 凶 的 可 
能 广 进 行 选择 呢 ? 皮 .和 费 二 和 信 的 工作 中 没有 涉及 到 这 个 重要 的 基本 
问题 ,而 奈 曼 和 爱 根 ， 皮尔 间 正 是 从 这 一 点 人 手 , 建 立 了 一 奢 有 效 
的 理论 ,从 而 又 上 了 一 个 新 人 台中. 


3 9.1 卡尔 ， 皮尔 人 还 的 拟 合 优 度 


I .意义 和 和 表 景 

我 没有 在 小 标题 上 可 上 “检验 ”二 字 , 因为 皮尔 进 那 篇 大 大 有 各 的 、 
狐 认 为 是 假设 检验 开山 之 作 的 论文 ,其 中 没有 一 让 所 到 “hypothesis 
testing 这 个 字 根 , 它 关 心 的 是 建立 -一 个 衡量 数据 与 其 "或 然 值 ? 拟 合 程 
度 的 数量 指标 一 一 goodness of fit ,现在 通 译 为 控 合 优 度 . 

皮尔 进 这 篇 于 1900 年 发 表 在 ¢ 暂 学 杂志 》 上 的 文章 的 题目 长 
得 吓人 : (on the criterion that a given system of deviations from 
the probable in the case of a correlated System of variables is 
such that it can be reasonabily supposed to have arisen from ran- 
dom sambling” .作者 的 文字 水 平 不 足以 将 这 样 的 长 句 译 戌 通顺 的 
中 文 , 站 对 其 意义 解释 如 下: 皮尔 吉 要 讨论 的 问题 是 要 建立 一 个 准 
则 ,以 判定 一 给 相关 变量 与 其 或 然 值 的 偏差 ,可否 被 人 台 理 地 解释 为 
是 让 王 随机 抽样 所 致 . 

举 一 个 例子 也 许 更 可 以 帮助 理解 : 设 有 一 组 n 个 点 维 数据 
(xi 2 它 放 被 认为 有 可 能 (但 不 一 定 ? 是 从 鞭 个 
其 期 望 tal,…,ar} 的 & 维 正 态 总 林 中 抽出 的 .计算 (7z,,…,z;), 其 

Bz, 


中 元 一 生 5 一 .元 的 “或 然 值 "是 a., 因 而 观察 结果 与 “或 然 " 值 有 仿 
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差 全 | a TO 这 一 组 偏差 基本 以 被 认为 仅 由 随 术 抽样 误 
莽 所 致 呢 , 还 是 另 有 原因 一 一 如 原先 以 为 的 "或 锥 值 "al， 和 ax 不 
对 ,甚或 分 布 也 不 是 正 态 的 ? 文 题 中 标 出 "相关 变量 ,是 为 了 强调 
问题 的 多 维 性 质 , 即 必须 把 假 差 Xi 一 ai 人 放 在 一 起 考 上 处 . 
因为 , 倘 知 各 候 差 独立 , 则 可 以 各 自 处 理 , 不 必 绑 在 一 起 了 . 

经 堵 百 年 ,由 于 表述 方式 及 用 语 避 懂 的 变迁 , 今 人 阅读 早期 统 
计 文 献 , 恕 痪 砍 尔 等 人 的 文集 , 常 觉 不 易 理 解 . 幸好 这 些 大 师 的 凌 
作 在 各 种 统计 文献 中 多 有 介 细 .我 们 多 半 是 居 了 事先 得 到 的 一 些 
理解 ,才能 读 慌 筷 们 的 作品 


从 数学 模型 上 讲 , 皮 和 尔 孙 这 篇 工作 讨论 的 是 一 组 实际 观察 结 

一 个 给 定 的 多 项 分 布 的 符合 程度 ,多 项 分 布 中 各 状态 1，… ,有 
的 概率 户 ，- ,和 假定 为 已 知 . 设 在 = 次 观察 中 发 现 各 状态 出 现 的 
频数 为 已 ,…', 有 ,而 按理 论 应 为 Ti,…,Te,T, 一 xp 问题 归结 为 
研究 这 两 组 频数 (EE,,…,E,) 和 (《T,，-…,7;) 的 符合 程度 . 皮尔 还 引 
进 了 一 个 刻 划 其 偏差 的 量 , 证 明 此 量 ( 在 理论 概率 p,,… , 思 ; 正确 
时 ) 近 似 地 及 分 布 ,利用 这 个 结果 去 计算 拟 合 优 度 , 这 是 一 个 介 
于 0,1 之 向 的 值 ,此 值 钝 大 , 则 氢 合 的 程度 分 好 ,或 者 说 ,我 们 全 能 
相信 不 先 设 定 的 理论 概率 值 p,,… ,ps 是 正确 的 . 由 于 皮尔 各 把 这 
个 反映 侠 差 的 量 记 为 巡 , 且 其 分 布 与 妃 分 布 有 密切 的 联系 , 它 也 
常 被 称 为 皮尔 迟 的 如 统计 量 . 皮尔 孙 在 此 文中 也 讨论 了 理论 概率 
不 完全 已 知 ,但 依赖 若干 个 参数 的 情形 . 

皮尔 避 之 所 以 考虑 到 这 个 问题 ,有 下 面 两 方面 的 背景. 一 是 
1985 年 皮尔 避 发 表 其 分 布 族 时 ,已 考虑 了 如 和 何 估量 族 中 的 分 布 与 
实际 数据 符合 程度 的 问题 ,他 在 其 1985 年 论文 (数学 用 于 进化 论 
1 3 中 ,已 提出 了 用 分 组 数据 的 多 边 形 图 与 理论 分 布 密度 比较 ， 
即 用 

基线 与 多 边 形 图 所 夹 面积 二 曲线 (或 多 边 形 图 ) 下 的 面积 
埃 其 湿 斯 曾 询问 此 量 的 确切 含义 ,守之 是 


2 5 


有 厅 


> 3 一 3 


1 Al | 
天 2 J 尽 Diy, 


中 的 哪 一 个 ,这 里 yy 和 分 别 是 第 ; 组 区 间 上 理论 曲线 与 多 边 形 
图 的 面积 . 皮尔 各 的 意思 是 指 后 者 面 埃 其 涛 斯 以 为 是 前 者 . 埃 其 源 


S|y,— —y, | 
斯 的 理解 更 接近 于 皮尔 逊 后 来 采用 的 类 统计 量 -= 


另 一 方面 的 动因 来 自 与 凡 博 和 挤 般 子 等 有 关 的 问题 . 皮尔 下 
注意 到 轮 私 同 中 各 状态 的 概率 与 实际 观察 到 的 严重 不 符 . 他 于 
1894 年 在 刊物 上 发 表 文 章 对 此 大 加 挫 伐 , 且 就 此 事 于 1893 年 开 
如 与 埃 其 涯 斯 通信. 皮尔 进 的 论断 是 建立 在 所 选 出 的 最 不 符合 的 
状态 上 的 分 析 . 埃 其 温 斯 外 他 指出 由 于 状态 众多 且 状 态 之 同 有 相 
关 性 ,这 人 么 处 理 丰 合适 . 他 主张 用 一 个 35 维 的 正 态 分 布 作 为 模型 ， 
但 又 党 得 实行 起 来 很 难 一 一 ”这 涉及 36 阶 行列 式 的 计算 ”皮尔 进 
在 其 1900 年 文章 中 实际 上 采纳 了 这 个 思想 ,但 找到 了 一 种 办 法 尼 
人 挎 处 理 这 人 么 商 维 的 问题 ,这 是 仓 盛 功 的 美 键 所 在 ， 

在 差不多 同一 个 时 间 , 威 尔 登 作 了 一 个 实验 ;把 12 有 颗 骨 子 同 
时 括 了 26 306 次 ,每 次 记录 下 共 中 出 再 5 或 6 的 颗 数 . 应 皮尔 进 
教学 上 的 要 求 , 威 尔 登 的 秘书 把 其 中 7 000 次 投 孝 的 结果 整理 出 
来 . 皮尔 还 在 检查 以 后 认为 不 可 靠 , 面 威 尔 登 认为 (记录 等 ) 并 无 问 
题 . 他 写 信 给 高 尔 登 说 "你 看 这 居 包 么 严重 的 一 件 事 六 . 

为 这 件 训 ,皮尔 进 \ 埃 其 兴 斯 和 威 尔 登 之 邮 有 多 次 通信 ,有 关 
情 沈 记录 在 爱 根 ， 皮 和 尔 进 的 * 生 物 计量 和 统计 学 的 早期 历史 :1890 
一 18943 一 六 中 ,长 语 短 说 ,皮尔 人 进 的 论断 是 建立 在 "个案 ”的 分 析 
上 ;了 他 观察 到 “4” 这 一 组 ‘ 即 12 颗 般 子 中 有 4 颗 出 现 5 或 6) 有 


1 571 次 ,机 其 理论 人士 应 汶 了 000，。 CE 二) 二) 659 多. 这 个 


差异 用 二 项 分 布 正 态 通 近 可 算出 极为 显 着 , 但 讨论 者 也 认识 到 这 
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国 半 让 放 证 持 款 乓 出 上 


样 取出 概 端 个 案 来 分 析 舍 有 不 肥 , 而 感到 需要 从 全 局 考虑 ( 爱 棋 。 
皮尔 迁 将 0,1,…,12 分 成 11 组 (10,11,12 在 一 组 ), 用 x 办 验 法 
算出 拟 合 优 度 为 9.088, 此 值 还 达 不 到 次 定 随 机 性 的 程度). 无 疑 ， 
通过 这 件 事 的 讨论 ,使 皮尔 逊 对 检验 密 个 相关 观察 值 的 所 合 问题 
加 深 了 理解 ,并 对 其 朝向 最 终 解 决 这 个 问题 的 努力 起 了 促进 作 
用 1 


I. 色 和 尔 进 文 昔 内 容 概要 

凡 水 渤 把 nn 个 量 与 其 或 然 值 的 偏差 记 为 ri，… ,zx 假定 它们 
的 上 方 关 六 他] 村 | i 的 要 关系 数 汶 上 HR 记 行 
列 取 120 之 值 ,Ro 为 r+, 的 代数 余子 式 . 皮尔 避 断 
言 , 这 组 变 景 的 “相关 曲面 ?是 


] R, 全 Re, .二 | 
2 (1 >》 
了 全 Ty 
| = 2 Roa, ol 

他 这 个 表 还 实际 上 隐 含 了 Cri yx) 服 亿 少 维 正 态 分 布 的 假定 ， 


甚 意 含 于 "相关 则 面 "一 语 . 当时 的 统计 学 家 们 能 理解 他 的 意思 . 但 
在 现今 让 一 位 没有 经 验 的 读者 去 看 , 难 和 能 有 * 堵 里 看 花 ” 的 感觉 ， 

他 接着 把 (1) 式 中 花 括 导 内 的 量 定义 为 她 (这 是 皮尔 各 妇 统 
计量 名 称 的 来 由) ,而 断言 此 量 服从 自由 度 为 的 关 分 布 宛 .他 
的 推理 很 别致 ;如果 把 曲 迁 1) 加 以 压缩 ,会 得 到 一 个 球 , 即 个 恋 
量 的 平方 和 ,因而 有 入 分 布 . 

这 个 推理 ,现今 的 读者 您 人 也 会 播 头 ,得 在 皮尔 进 当 时 却 是 极 
为 自然 . 因为 我 们 记得 (第 七 章 ) ,皮尔 逊 曾 在 1896 年 解决 了 正 态 


> 这 个 臣 事 肾 能 有 所 启发 克 了 说 明 , 一 种 看 来 无 用 的 活动 (赌博 迫 酸 子 之 类 + 有 
时 对 重要 的 科学 问题 起 了 了 意 想 不 到 的 作用 外 ,也 说 明 : 统 计 学 家 对 关于 随机 性 的 直 哆 
体验 很 至 又 ,这 种 体验 有 时 可 以 通过 一 些 易于 实 读 的 实验 和 观察 而 获得 . 在 中 南 统 计 
学 家 的 培 非 工作 中 这 方面 的 注 囊 般 平 本 少 . 
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分 布 的 主轴 问题 , 凌 悉 该 问题 原委 的 人 当然 立即 看 出 其 中 的 论据 ， 
用 我 们 现在 的 记 法 , 它 是 下 述 熟 知 的 定理 ; 若 羡 一 NN(0,; 和 修 ); 革 为 
nn 维 , 则 六 大 六 一 息 . 

然后 ,车 是 把 由 实际 算出 的 站 统计 量 值 记 为 癌 ; 皮 年 训 计算 
概率 

P= PX, 一 (2) 

看 出 皮尔 还 是 取 加 而 非 加 的 分 布 一 一 当然 ,这 也 可 以 通过 用 各 
分 布 绊 人 台 一 个 向 单 的 变换 达到 ,当时 尚 股 有 现成 可 用 的 形 分布 
表 , 故 皮尔 扣 在 文章 中 花 了 不 少 往往 讨论 52? 式 中 积分 的 计算 
问题 . 

接着 进入 到 论文 的 核心 部 分 一 一 客 项 分 布 的 拟 合 问题 .上 应 尔 
带 设 一 共有 n 十 1 个 状态 ,其 观察 频数 和 理论 频数 分 别 记 为 mm,'， 
一 一 zz 他 注意 到 ej 十 * 十 6, 一 
0 ,因而 只 须 就 了 个 俩 差 去 计算 51) 式 中 的 二 次 型 .由 于 他 不 用 此 
阵 ,引进 了 一 些 三 角 畏 数 且 有 不 少 复杂 的 行列 式 , 计 算 很 元 长 . 用 
现在 的 记 叶 和 末 用 矩阵 算法 ,很 容易 得 出 他 的 结果 ( 注 1). 

长 话 短 说 ,最 后 他 得 到 表达 式 

SY me 777， 了 


Ys r= 二 | 


即 我 们 在 初等 教科 书 中 熟 亚 的 公式 . 由 于 在 计算 中 只 用 了 个 偏 
莽 , 昌 由 度 只 有 7 而 非 nn 二 1. 

皮 不 避 用 Xx,* 分 布 计 算 此 量 的 拟 合 化 度 . 现在 我 们 都 知道 ， 
(3) 式 的 统计 量 只 是 在 极限 的 意义 (观察 数 ->co}) 上 有 元: 分布， 
国 此 度 尔 逊 这 个 结果 是 一 个 大 样本 结果 ,其 衫 据 是 (Cr 一 mm 
ma 一 六 由 汤 近 于 维 正 态 .皮尔 避 在 文章 中 未 明言 这 个 极限 性 质 ， 
但 他 心中 当然 清楚 这 一 点 ,因为 这 种 表述 方式 也 是 当时 的 习惯 . 
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往 下 皮尔 必 考 虚 带 参数 的 情形 . 他 作 了 阁 干 推导 ,证 明 在 这 种 
情 沉 下 自由 度 不 变 . 这 个 推导 是 错误 的 ,因为 他 未 能 正确 评估 有 关 
的 项 的 数量 级 ,因而 忽 罗 了 某 些 不 能 智 略 的 项 . 这 个 错误 首先 为 费 
区 和 尔 所 发 现 , 他 在 1924 年 得 出 了 正确 的 结果 . 为 此 事 现 人 进行 了 长 
时 间 的 争论 ,上 成 为 20 世纪 初期 统计 史上 的 一 个 重大 事件 .有 关 情 闹 
将 在 后 面 介 绍 . 这 也 是 皮尔 示众 密 工 作 中 一 个 比较 重大 的 失误 - 

最 后 上 庶 尔 各 举 了 若干 应 用 例子 ,其 中 之 一 是 感 尔 登 那 个 12 骸 
子 掷 26 306 次 的 试验 .皮尔 氨 分 成 0,1,*…',12 等 13 个 组 ,算出 
值 43. 872 1, 拟 食 优 度 为 0.000 016, 足 可 以 否定 “锅子 均匀 "的 
很 设 . 皮尔 氨 的 分 组 中 ,10,11.12 这 3 组 的 观察 息 只 有 1.9,0, 因 
此 将 其 合成 一 组 较为 合理 .作者 作 了 这 一 计算 ,得 到 拟 合 优 诬 
0. 000 087, 曙 有 所 升 高 ; 仍 不 能 改变 诛 有 结论 . 后 来 威 尔 登 建议 按 
二 项 分 布 40.337 7 十 0.662 3)? 去 氢 合 . 皮尔 于 算出 拟 合 优 朗 为 
0. 122 7; 已 福 可 接受 的 范围 内 . 看 来 盘子 均 每 度 有 一 个 10 ;数量 
级 的 侦 差 .让 于 试验 次 数 很 大 ,这 个 伪善 也 被 检验 出 来 了 ， 


下 . 放 尔 逊 和 费 软 尔 的 争论 

皮条 如 在 这 篇 论文 中 有 一 个 重要 错误 , 即 在 考虑 当 多 项 分 布 
的 概率 依赖 于 若干 个 参数 的 情况 时 ,认为 最 后 所 得 的 X’ 统计 量 的 
是 由 度 不 受 影响 , 即 与 这 些 概率 完全 已 知 时 的 情况 一 样 ,在 总 的 身 
由 上 度 不 太 大 时 ,这 会 对 执 合 优 度 的 计算 产生 相当 大 的 影响 ,在 施 异 
状态 附近 甚至 可 能 对 数据 与 分 布 是 否 拟 合 作出 错误 的 判断 . 

直到 1922 年 之 前 的 20 余年 时 间 , 无 人 提 及 这 个 问题 ,有 可 能 
是 由 于 此 错误 比较 隐 蛇 ,不 易 察觉 , 但 到 1922 年 ,这 个 问题 终于 由 
资 阮 尔 所 发 现 . 他 在 这 年 发 表 的 文章 4 列 联 表 的 态 统 计量 的 解释 》 
中 ,就 列 联 表 这 个 最 重要 的 特例 分 析 了 其 x: 统计 量 的 自由 度 
问题 ， 

考虑 一 个 > Xe 鹿 联 可 ,其 全， 门 榨 的 观察 频数 为 Kj 所 让， 一 


冯 


Dn = nsn 一 Dm. 一 >in,,, 则 (i, 户 格 的 理论 频数 为 


+=1 


IN.. 一 nn.,, Hi, 
一 ”一 一 一 一 . 证 Ee;, = Nj;, ri 则 有 


机 


工 三 
Se, = 让 f 二 ] yer rs Se,, = 局， 一 一 Lo"* 二 
一 一 Tc 一 ] 


总 共有 rr 十 s 个 揭 束 ,但 只 有 rr 十 sz 一 2 个 是 独立 的 :前 依 费 区 多 :此 
问题 的 祈 统 计量 的 目 由 度 应 为 
(75 一 1 一 (Cr 十 ss 一 2 一 4 一 1 一 1 ， 

而 和 不 是 皮尔 逊 所 主张 的 产 一 1. 看 得 出 来 , 费 歌 尔 在 这 里 得 力 于 他 
在 用 “* 维 斤 何 "的 观点 处 理 统 计量 分 布 时 所 发 展 的 关于 ”月 由 度 - 
的 直观 概念 . 但 单 是 这 样 的 推理 尚 不 中 以 使 皮 和 尔 避 信服. 于 是 , 费 
殴 和 尔 特 别 对 2xX2t 四 辕 表 的 情况 作 了 一 个 单独 的 分 析 . 以 x, 记 
4 因 守 取水 平 i,B 因 人 宗 取 水 平 了 的 观察 频数 , 则 


?一 及 因素 取水 平 1 时 ,4 因素 取水 平 1 的 频率 


rl 


7 一 BB 因素 取水 平 2 时 ,4 因素 取水 平 1 的 频率 . 


i 


这 样 , 当 4.B 两 因素 独立 时 ,和 二 是 同一 概率 的 估 值 ,因而 当 


Ri | 


再 。 RR, 
所 = 
1 MI, Ts, 十 1 HI. ?tt,. = 
Nn. 天 He 只 


应 渐 近 于 正 态 N (0,1), 因 之 及 * -二 Xi, 但 易 算出 


四 CHAyN22 Na 
(C11. Hf 1 > 


RR 


和 


世 正 古 四 略 表 的 光 统计 量 . 因此 在 2x2 四 格 表 这 个 场合 , 关 统计 
量 的 自 宙 度 应 为 1; 与 费 葡 和 汞 的 公式 (2 一 1)，(2 一 1) 符 合 , 而 按 皮 
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条 迁 , 昌 由 度 应 为 4 一 1 一 3. 

环 我 们 今天 看 来 , 费 砍 尔 分 析 的 这 个 特例 已 足以 证 明 皮 尔 吉 
的 错误 一 一 虽然 严格 讲 , 尚 不 足以 证 明 费 歌 尔 关于 “有 多 少 个 参数 
就 要 减 去 多 尹 个 自由 度 "的 论断 .但 当时 度 尔 还 是 英国 统计 界 德 高 
望 重 的 权威 , 随 大 地 位 的 升 高 与 年 龄 的 老化 :他 当时 已 65, 费 歌 尔 
32) ,性 格 上 有 其 固执 之 媒 , 不 易 接受 不 同意 见 , 何 沉 费 黑 尔 当时 唱 
已 在 统计 异 训 露头 第 ,毕竟 还 只 是 农业 试验 站 的 一 各 统计 师 . 因 
此 ,点 乏 于 在 当年 就 进行 了 反 驶 ,他 在 4 生物 计量 }》 洒 志 上 发 表 了 题 
为 4 关于 拟 合 优 度 检验 进一步 的 注 记 3》 的 文章 ,其 中 说 “我 希望 
我 的 批评 者 原谅 我 把 他 上 比 作 撞见 夺 的 唐 吉 启 德 ”. 但 是 ,他 这 一 次 
到 了 认真 的 黑 纳 尔 儿 :和 间 葡 乐 ,下 决心 要 把 问题 摘 个 水 蒂 石 出 . 
正好 在 1922 年 , 约 尔 发 表 了 了 一 篇 文章 #X: 法 用 于 列 联 表 及 实验 例 
证 》, 文 中 用 随机 模 所 法 列 出 了 350 个 2x2 表 ,是 在 两 因素 独立 是 
各 水 平 有 固定 概率 的 情 沈 下 取 的 . 费 砍 尔 在 1923 年 利用 这 个 资料 
进行 了 计算 ,结果 列 为 下 表 : 


x 值 的 区 间 | 观察 频数 | 按 x 的 理论 频数 | 按 必 的 理论 频数 


QU. 25 ] “2 134. Oz 10. BU 
.25~0. 50 4 二 1» 17. 28 
他。 50D. 78 本、 局 ZU. 43 
全、 75 1. O00 2 24. 1 21. U5 

1 一 G2 56. OD SO. 10 
并 18 25. 91 03. 27 
3 一 4 13 13. er 45. 56 
和 一 9 b 1 Dn 31. 38 
9~—b 5 3. 86 21. 07 
7 9 +. Ql 39. D06 
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表 中 第 2 询 是 那 350 个 2X2 表 中 ,其 x 值 落 入 所 标示 的 区 则 内 
的 个 数 , 第 3,4 列 是 按 此 x 值 服 从 入 分 布 或 六 分 布 时 应 有 的 理 
论 频数 . 检视 此 表 容 易 看 出 ;Xi 与 观察 频数 符合 较 好 而 六 则 与 之 
相去 甚 远 . 费 散 尔 就 此 写 了 题 为 # 观 窒 熏 与 很 设 的 一 致 性 的 统计 检 
验 放 的 论文 ， 

1924 年 , 费 散 尔 发 表 题 为 kX 作为 庶 量 观察 信 与 很 设 间 的 偏 
差 的 条 件 》, 从 理论 二 分 析 了 上 应 尔 示 推理 中 癌 题 之 所 在 . 

上 诺尔 带 的 推理 如 下 ;以 口 ; 记 观 察 频数 ,E, 入 ,分别 记 理论 频 
数 zz) 和 np,(9 ) ,其 中 名 是 参数 真 值 ,9 是 其 估 值 . 记 
SO EY 0 
一人 
皮尔 过 记 训 一 上 ,一 Ei'. 出 由 和 参数 估 慎 而 计算 出 的 究 统 计量 为 
> (0, — EY 
ET 
于 是 经 过 简单 的 代数 运算 ,得 

(OO 一 五 — py 
2 Er yy > pe CO 严 ，“ 
+ 2 入 一 之 Er 2 

皮尔 如 认为 ， 当 样本 星 nn 很 太 时 ,EE; 和 瑟 ' 很 接近 ,mm 一 所 一 已 :很 
小 , 故 上 式 右边 后 三 项 当 # 很 大 时 可 忽略 不 计 , 因 而 和 Xe 与 妇 应 有 
同一 之 极限 分 布 . 

问题 就 出 在 这 里 :此 式 右 边 后 三 项 并 非 都 能 忽略 不 计 . 因为 ， 

p=np O00) — p09 )). 因 GG 6, 为 "的 数量 级 故 产 为 对 的 
数量 级 ,EE,' ,O, 等 都 是 1 的 数量 级 , 故 志 -一 PoE 所 项 有 数量 级 
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x 一 


Er 


xX” 一 


X* 一 


Of Gn’ | yery. 


并 不 能 希 格 不 计 . 第 2 项 疗 然 ,只 第 4 项 可 以 忽略 不 计 . 费 葡 尔 在 


其 上 引 1924 年 论文 中 ,对 六 作 了 更 精密 的 分 析 , 清 楚 的 显示 出 了 
有利 由 度 泪 少 的 原因 . 他 的 证 明 从 严谨 的 数学 标准 看 还 嫌 不 驶 ,但 实 
质 是 正确 的 ( 注 2). 

于 然 有 了 如此 入 切 无 物 的 证 据 ,但 统计 学 界 当 寺 对 此 事 仍 是 
意见 分 歧 . 如 费 奔 尔 的 女儿 在 为 其 父 所 作 的 传记 中 所 说 ,一 些 统 
计 党 家 仍 追 随 度 尔 还 的 作法 , 另 一 些 人 则 认为 这 是 一 个 商 庆 技术 
性 的 问题 ,更 多 的 统计 学 家 逐渐 站 到 了 费 融 尔 的 一 边 . 这 种 情况 的 
出 现 , 除 了 卡尔 :+ 皮尔 还 的 威望 是 一 个 因素 外 , 当 寺 的 多 数 应 用 统 
计 学 家 可 能 难 予 理解 一 些 纯 理 论 性 的 论据 ,也 有 一 定 的 关系 .但 到 
1926 年 ,发生 了 一 件 可 以 把 此 事 付 诸 实 验 的 事件 . 为 验证 贝 叶 斯 
定理 , 爱 根 "皮尔 下 在 1926 年 发 表 了 一 个 模 氢 试验 ,产生 了 的 
12000 个 2x2 四 格 表 . 竟 鞭 和 指 出 ,这 些 表 的 迷人 秆 的 算术 平 震 为 
1.02941. 按 如 ,理论 著 庶 胃 1; 此 值 与 1 的 误差 在 合理 的 范围 内 ， 
而 与 按 双 的 理 沦 值 3 相去 其 远 . 对 此 皮尔 下 未 作 管 ,估计 他 此 时 
已 相信 了 兽 欧 尔 章 见 的 正确 性 . 

里 然 有 这 点 开 六 , 并 不 影响 此 文 在 统计 于 上 的 崇高 地 位 . 它 是 
数理 统计 史上 的 一 块 丰 碑 . 有 一 种 意见 认为 此 交 是 近代 音义 的 数 
理 统 计 学 的 开始 . 这 个 说 法 也 许 还 有 可 设 之 处 ,但 块 非 空穴来风 . 
旨 困 说 ,皮尔 浊 这 项 工作 ,以 及 随后 的 Student 和 费 避 尔 等 的 工 

作 ,标志 着 统计 学 最 终 告别 以 描述 性 为 主要 特征 的 圭 代 而 全 面 进 
入座 六 格 的 概率 方法 为 基础 的 推断 时 代 , 应 当 是 可 以 成 立 的 . 此 
外 ,此 文 的 实用 意义 也 很 重大 . 皮尔 避 提 供 的 方法 应 用 面 广 ; 不 论 


上 泊 时 部 他 统计 学 家 对 费 歌 尔 公开 指 批 一 位 太 师 工作 中 的 问题 , 抱 有 一 -种 不 届 
轩 执 的 情绪 . 1925 年 ,有 一 位 学 荐 在 评论 费 歌 尔 的 新 作 + 研 究 工作 者 用 的 统计 方法 3 时 
写 遭 我们 刚才 听见 一 个 时 儿 骑 在 人 性 信 亲 府 上 友和 柯 ， :我 比 我 父亲 高 拇 志 1 


2 


是 一 维 或 儿 维 ,离散 或 连续 以 及 分 布 完全 已 扼 或 否 , 都 可 以 用 旦 计 
算 上 不 太 繁 . 直到 如 今 , 它 还 是 最 常用 的 一 种 拟 合 优 度 检验 法 . 

皮尔 撑 妨 检验 法 以 外 的 氢 合 优 度 检验 法 ,以 前 苏联 大 数学 家 
和 概率 学 家 柯 尔 划 再 洛 夫 (上 A. H. Kolmogorov,1903 一 1987) 在 
1933 年 提出 的 检验 法 最 为 著名 . 此 法 是 以 经 验 分 布 与 理论 和 分布 之 
计量 { 称 为 柯 氏 统计 量 ) 的 极限 分 布 ,以 此 可 作为 大 样本 检验 的 基 
础 . 1956 年 ,我 国 统 计 学 家 张 里 干 求 出 了 柯 氏 统计 量 的 确切 分 布 
比 ,在 分布 为 一 维 连 续 且 完全 已 知 的 情况 下 , 柯 氏 的 方法 在 功效 上 
比 皮 尔 示 的 略 优 , 且 柯 氏 统 计量 的 值 不 像 皮尔 避 产 统计 量 那 样 依 
赖 于 数据 分 组 的 方法 .但 柯 氏 方法 不 能 用 之 于 不 连续 、 高 维 以 及 市 
戎 数 的 情 沈 . 

另外 在 应 用 上 重要 的 是 检验 一 组 数据 是 否 符 合 正 态 分 布 , 因 
此 和 针对 这 个 特 鲁 提出 了 一 些 检 验方 法 . 


39.2 ”费时 和 尔 的 显著 性 检验 


费 砍 和 汞 关于 假设 检验 的 主要 著作 包括 3 篇 论 文 :$$ 回归 公式 的 
氢 侣 优 度 及 回归 系数 的 分布》(1922 年 ) ,关于 一 个 引出 若干 周 知 
统计 量 的 误差 本数 的 分 布 ?》(1924) 及 《Student 分 布 的 应 用 》 
(1925). 在 这 些 划 基 性 工作 中 ,他 创立 了 在 实用 中 常用 的 基于 上 分 
布 和 五 分 布 的 检验 . 另外 还 有 两 本 著作 :发 表 于 1925 年 的 《研究 
工作 者 用 的 统计 方法 》, 其 中 有 好 几 章 的 内 容 与 假设 检验 有 关 , 包 
括 拟 合 惰 度 检验 ,均值 和 回归 系数 的 显著 性 检验 ,方差 分 析 及 其 应 
用 等 ,主要 通过 数字 实例 来 演示 统计 方法 的 使 用 . 男 一 本 是 发 表 于 
1936 年 的 # 试 验 避 计 ,其 中 发 挥 了 恺 的 显著 性 检验 的 思想 . 
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与 卡尔 ， 皮 儿孙 处 理 的 大 量 由 自然 班 察 得 到 的 数据 相反 , 费 
区 和 尔 关 心 的 问题 ,是 从 大 为 试验 中 得 到 的 少量 数据 中 ,去 检测 所 关 
旋 的 某 项 效应 之 有 无 . 例如 用 一 种 预期 能 增产 的 农业 品种 来 取 民 
现 用 品 神 . 新 品种 的 增产 效应 基 否 确实 呢 ? 这 需要 通过 试 驻 收集 数 
据 来 检验 , 费 砍 和 尔 把 这 种 检验 叫做 显 善 性 检验 . 在 # 试 验 设 计 # 这 一 
著作 的 前 3 章 中 ,他 提出 了 有 关 证 计 试 验 和 进行 显著 性 检验 的 一 
些 基 太原 则 . 
费 克 和 尔 指出 :一 个 试验 的 分 析 和 解释 ,与 该 试验 的 结构 密 不 可 
全 ,因而 为 了 能 通过 实验 获取 新 的 知识 ,必须 有 某 些 原则 厦 在 . 特 
别 是 ,机 使 在 归纳 性 推理 中 必然 在 在 的 不 确定 性 ,能 通过 概率 从 数 
量 上 下 表示 出 来 . 他 认为 ,适当 地 设计 试验 ,就 能 达到 这 一 目标 , 而 这 
个 所 谓 " 和 庆 当地 "的 会 多 ,和 包 舍 现 个 要 点 :一 是 试验 要 有 随机 性 ,以 
使 检验 统计 量 服 从 一 定 的 概率 分 布 :二 是 包含 重复 .分 区 组 等 技 
I ,以 降低 误差 的 影响 而 提高 试验 的 沁 秀 度 ， 
交 于 “显著 性 检验 ”的 实质 , 间 砍 尔 提 出 以 下 几 点 解释 : 
1. 有 一 个 命题 , 称 之 为 * 零 假 设 " 或 “ 解 消 假设 ”Cnull hypothe- 
sis) ,其 人 窗 义 是 :所 关心 网 效应 寺 存 在 {不 存在 即 为 0,* 效 应 不 存 
在 "Rh“ 解 消 ” 了 “有 效应 ”的 说 法 ). 设计 试验 的 惟一 生 的 ,是 寻 求 否 
定 和 要 假设 的 证 据 . 
2 可 找到 一 个 统计 量 了 ,其 值 可 按 对 和 否定 零 假 证 所 提供 的 证 
据 强 史 来 排序 ,比方 说 .了 值 傅 大 ,否定 零 和 假设 的 证 据 傅 强 . 零 假设 
实 正 够 确定 ,局 得 在 它 成 立 的 前 提 下 ,可 算 册 了 的 确切 分 布 . 这 个 
分 布 的 根据 就 包含 在 试验 的 具体 设计 中 . 
3. 生 在 试验 中 得 到 工 值 为 了 , 则 六 7 的 一 坊 荆 值 ,是 比 本 
实验 所 得 值 更 个 向 于 否定 零 假 设 的 全 部 情况 .计算 概率 
天 (| 霉 假 设 成 立 ) 王 户 
如 六 很 小 , 则 说 明 :在 替 假 设 成 立时 , 极 不 容易 得 到 闻 T, 的 了 值 . 
而 现在 居然 得 到 了 ,因而 是 “ 零 假 设 不 对 ”的 有 力 证 据 . 因此 ,征文 
1 和 的 显著 性 水 平一 疡 (C4) 
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至 于 p 要 小 到 包 少 才能 被 认为 是 零 假设 不 成 立 的 充分 证 所 ,这 不 
能 给 出 公认 的 界限 ,是 根据 问题 的 具体 性 质 及 当事人 的 倾向 性 来 
决定 的 . 如 ps0.01, 称 0.0]1 的 显著 性 水 平 .通常 讲 显 著 性 水 平 商 
是 指 这 概率 优 , 这 是 习惯 讲法 ,不 要 与 (4) 式 混 湛 . 

费 歌 尔 通 过 两 个 实例 来 解释 这 些 概念 ,一例 是 人 为 的 “ 妇 士 号 
茶 ? 试 验 . 牛奶 茶 是 茶 与 牛奶 按 一 定 比 例 之 混合 .在 制作 时 有 两 种 
方法 : 先 放 和 牛奶 后 放 茶 CMT), 先 放 蔡 后 放 和 牛奶 (TWD). 某 杂 士 声称 
她 能 鉴别 HT 和 TWH, 于 是 做 一 个 试验 来 判断 她 所 说 的 是 否 有 根 
据 . 准备 8 杯 牛 奶茶 ;2HT 和 了 TAz 各 半 , 给 这 位 站 土 喝 , 让 她 把 MT 
和 TM 分 准 出 来 { 先 告 诉 她 各 有 4 和 丁 ). 扩 工 识 她 说 对 的 杯 数 . 则 工 
只 能 到 8,.6,4,.2 种 全 等 5 个 值 . 

立 下 零 假 设 * 该 女士 没有 辨别 nz7 和 TM 的 能 力 ”. 这 时 ,好 
也 给 她 8 杯 中 挑 出 4 杯 ( 必 为 7) 的 方法 ,与 随机 地 从 8 杯 中 挑 
出 4 杯 是 一 样 的 . 由 此 不 难 算 出 ,在 零 假设 成 立时 ,x 的 分 布 为 


+ 值 3 各 生 之 必 
1 1 3 168 1 
慨 窑 大 i 70 70 70 
取 检 验 统计 量 了 一 xz,T 值 急 大 , 急 说 明 该 女士 有 分 辨 力 而 更 倾 间 
于 否定 零 和 要 设 . 设 丁 一 8, 即 女士 全 说 对 了 ;这 时 按 (4) 式 ;显著 性 水 
平 为 


p=P(T 之 8) 二 高 和 ~0. D1 和 4， 
显著 性 很 高 ,有 理由 认为 可 否定 零 假设 一 一 当然 ,这 也 随 试验 者 的 
看 法 而 异 ,也 可 能 他 不 认为 这 个 结果 已 提供 了 强 有 为 的 证 据 - 这 时 
他 可 加 六 力 度 , 例 站 把 8 杯 改 为 12 杯 (CT ,TM 各 0. 这 时 在 零 
假设 下 ,了 一 12 的 概率 只 有 ai“0. 001 1. 如 果 某 女士 试验 结果 为 


T 一 12, 则 否定 零 假设 的 证 据 就 有 力 得 多 . 
仍 回 到 费 歌 饼 的 试验 . 阁 了 了 二 6, 成绩 也 很 可 观 , 但 此 时 的 显著 
性 水 平 为 
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1 
户 二 忆 ( 了 之 0 一 而 十 有 一 贡 


就 是 说 , 仅 任 腾 磁 , 也 有 近乎 二 的 机 会 取得 比 该 女士 一 样 或 更 好 的 


成 绩 , 因 此 这 没有 为 否定 零 假设 提供 了 车 何 的 根据 . 

费 软 尔 强调 零 假 设 不 能 被 证 明 . 如 此 例 得 工 一 6, 我 们 说 不 能 
否定 零 假设 ,但 也 不 说 明 零 假设 就 对 了 . 因为 该 女士 可 能 有 一 定 程 
度 ( 但 非 100%) 的 鉴别 力 , 例 如 判 对 率 为 所 , 那 也 可 以 很 好 地 解释 


人 二 6 这 个 试验 结果 . 

本 例 中 的 设计 部 分 有 两 个 方面 :一 是 保证 随和 机 性 , 划 MT 和 
TM 从 杯子 等 外 表 上 不 能 有 差异 , 旦 是 按 随 机 的 次 序 ( 如 通过 措 
球 ) 把 这 8 杯 依 次 交 给 该 女士 . 这 个 作法 保证 了 费 黑 尔 的 上 述 第 2 
亲 原 则 ;在 零 殷 设 成 立 的 前 提 下 ,可 算出 检验 统计 量 的 确 姑 分布 . 
为 -一 方面 是 杯 数 及 预定 HT 和 TM 的 数目 . 比方 说 ,在 预定 8 标 
时 ,是否 把 MT 和 TM 各 取 一 半 为 好 ,还 是 其 他 数目 ,如 MT2 标 ， 
了 M6 标 ? 还 有 ,是 告诉 该 女士 MT 和 TM 各 多 少 杯 好 ,还 是 不 上 告 
诉 她 好 ?对 标 数 , 当 然 多 一 些 试验 的 灵敏 度 高 ,但 有 一 个 代价 问题 
《入 力 物力 时 间 ). 这 问题 在 此 例 中 世 许 不 显著 ,但 在 费用 昂贵 卓 安 
排 旗 验 划 时 费 人 的 场合 ,就 是 一 个 不 得 不 考虑 的 因素 . 至 于 MT 
和 TM 的 数目 ,肯定 是 各 半 为 好 . 如 在 8 标的 情况 ,车 mW 取 2? 


杯 , 则 该 女士 全 说 对 时 ,显著 性 水 平 还 只 有 坊 , 远 不 如 取 4 杯 时 的 


夯 为 好 . 关于 是 否 把 MT 的 杯 数 告诉 该 女士 的 问题 , 则 是 不 告诉 
时 灵敏 度 更 高 如 在 8 杯 而 MT 有 4 标的 场合 , 若 不 告诉 该 女 士 ， 
则 她 由 于 了 瞳 磁 而 全 碰 对 的 机 会 只 有 3 站, 比 贡 的 量 著 性 高 , 仅 是 这 


样 一 个 简单 例子 就 有 如 此 多 的 考虑 ,在 复杂 的 情况 下 当然 更 是 如 
此 ,这 说 明 试验 设计 的 重要 性 ， 
费 歌 尔 利用 他 提出 的 原则 ,在 《试验 设计 ) 第 三 章 中 讨论 了 一 
al 


个 实际 向 题 ,这 是 达尔 文 一 个 试验 的 数据 ,目的 是 比较 两 种 施肥 方 
法 4. 吾 对 某 种 作物 高 度 的 影响 , 共 选 了 15 块 太 小 形状 一 样 的 地 


块 ,每 块 等 分 ,其 中 一 小 块 用 4A, 另 一 块 用 B. 结果 是 (单位 :计时 》， 


地 块 (| 1 2 3 4 9 B -8 3 lo ll lz 13 14 15 


ISB 96 168 176 153 172 177 163 146 173 186 168 177 工 38 
i |i39g 163 160 160 1l47 149 149 22 132 144d 130 14d4 Toz l124 144 
着 | 49 一 67 8 16 6 23 28 41 14 29 56 24 75 60 一 48 


费 点 尔 假 定 这 些 莽 是 从 正六 NCaso 中 搂 出 的 样本 ,和 解 洪 假 设 相 
当 于 4 一 ,于 是 可 用 Student 1! 分布 检验 之 ;了 到 天 = 


0) , 则 费 欧 尔 的 前 述 第 2 条 原则 全 部 满足 ; 当 零 假设 


4 一 0 成 立时 , 有 -个 确定 的 分 布 ;7 值 意 大 , 和 否定 零 假设 的 理由 
食 强 . 就 此 例 费 歇 尔 算出 全 信 2. 148, 显 著 性 水 平 为 0. 048. 

本 例 与 女 土 品 茶 那 个 例子 比 ,有 一 个 重要 的 区 别 . 在 女士 品 茶 
的 例 中 ,只 要 简单 的 随机 性 条 件 满足 , 则 了 在 零 假 设 下 有 确定 的 
分 布 , 无 须 任何 其 他 的 假设 ,此 处 则 不 然 - 由 于 15 个 地 块 并 非 均 
匀 , 各 个 差 的 方差 均一 这 一 点 . 与 实际 情况 会 有 些 工 离 . 每 地 块 中 
隔 小 块 条 件 不 可 能 绝对 一 致 最 后 ,分 布 的 正 态 性 也 只 是 一 个 候 
定 . 因此 , 费 敬 尔 的 第 2 条 原则 的 满足 ,在 此 只 是 在 一 堆 假设 的 前 
提 下 ,至 多 只 能 算是 一 个 近似 . 这 种 情况 是 实际 问题 的 通 例 . 所 谓 
给 一 个 统计 问题 选择 模型 ,无 非 就 是 选择 一 些 适当 的 、 从 实用 角度 
看 来 合理 (这 要 由 试验 的 设计 来 保障 ) 的 假定 ,以 使 费 欧 尔 的 第 2 
条 原则 能 满足 . 费 歇 尔 记 制定 的 一 些 在 应 用 上 很 重要 的 、 基 于 :分 
布 和 下 分 布 的 检验 ,都 是 属于 这 种 模式 . 这 构成 了 他 对 假设 检验 
这 个 领域 的 主要 责 献 

费 默 尔 在 1920 年 代 当时 即 已 认识 到 此 中 的 局 限 性 . 到 底 ,“ 正 
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态 "“ 等 方 盖 " 之 类 ,都 是 一 种 人 为 性 的 假定 .不 考虑 具 传 的 试验 环 
境 和 材料 ,而 一 际 套 用 这 类 假定 ;总 是 一 个 理论 中 的 不 足 之 处 ,有 
时 也 会 有 损 于 实用 . 为 此 , 费 歌 尔 提 出 ,应 当 把 随机 性 的 考虑 仪 寄 
托 在 实 有 试验 资料 的 可 变性 上 { 刀 参 与 试验 的 地 块 条 件 之 不 同 ). 
为 此 ,他 对 达 汞 文 上 述 试 验 作 了 另 一 种 解释 . 设想 达尔 文 在 每 地 块 


的 两 小 块 中 实行 了 随机 化 , 即 让 4 和 吾 各 有 寺 的 概率 占用 两 小 所 


中 的 性 一 扫 ,而 把 零 假 设 和 解释 为 :A,B 在 浆 应 上 不 存在 差异 ,所 观 
罕 到 的 表面 差异 ,全 是 由 于 隧 桃 化 的 偶然 性 所 致 ( 例 如 ,和 随机 化 的 
结果 ,使 每 地 块 内 条 忻 较 优 的 小 块 较 多 地 分 给 了 及). 比如 就 第 1 
地 块 而 言 , 实 际 试验 结果 A 优 于 五 ,但 (在 零 鼻 设 下 1) 这 是 由 于 4 
古 瑟 分 到 了 “好 小 块 ”, 而 不 是 由 于 4 优 计 吾 . 如 果 随 机 化 的 勿 华 
倒 过 来 , 则 此 地 氧 内 的 结果 将 是 A139, B8188. 其 余 各 块 类 推 . 费 敏 
水 称 这 为 一 个 更 广 的 零 假 设 . 
驴 此 例 而 言 , 每 地 志 在 施行 随机 化 时 ,有 2 个 可 能 铺 昌 (4 好 

呈 坏 ,4 坏 互 好 ). 枚 就 整个 试验 言 , 和 随机 化 的 全 部 不 同 结 果 有 22 
个 . 考虑 统计 量 

了 二 | 夺 小 块 和 一 BB 小 块 和 |， 
则 由 表 中 “ 差 * 一 栏 可 知 ; 本 例 了 可取 25 个 值 (相同 的 值 也 分 开 
息 ), 即 

| 士 49 十 67 士 8 士 16 士 ,… 士 50 士 48 |. 
而 本 例 实 得 了 值 为 

5 一 149 一 67 十 8 十 一 48| 一 314. 
费时 秒 将 2“ 个 工 什 排序, 发现 其 中 有 1670 个 大 于 工 ,,56 不 等 于 
;这 样 算出 姑 芳 性 水 平 为 

p= 3143456) 
与 用 正 态 理论 算出 的 值 0. 048 很 接近 . 这 个 分 析 有 两 项 重要 意义 ， 

i. 它 建立 了 一 个 模式 ,在 此 模式 下 , 零 假设 的 检验 只 依赖 于 对 
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实 有 试验 资料 的 随机 性 操作 ,而 与 外 加 的 诸如 “ 正 态 ,等 方差 ”之 类 
的 假定 无 涉 . 这 与 女士 吕 茶 的 例子 相似 ， 

2. 它 显示 (至 少 在 这 个 实例 中 ), 用 这 种 较 广 的 模型 的 计算 结 
果 , 与 用 通常 正 态 假定 算出 者 基本 一 致 . 如 果 这 是 一 个 一 般 规律 ， 
那 意义 就 很 重大 了 . 因为 ,在 样本 量 较 大 时 ,随机 化 方法 涉及 的 计 
算 量 太 大 ( 若 有 100 地 块 , 则 有 2” 个 值 要 算 ), 实 际 无 法 执行 ,而 
用 正 态 法 则 计算 简便. 如 二 者 计算 基本 一 致 , 则 二 者 可 统一 起 来 ， 
面 我 们 可 对 通常 基于 正 态 的 检验 法 ,给 予 一 个 全 新 的 更 贴近 实际 
的 解释 . 

这 正 是 费 答 尔 的 基本 想法 . 这 把 他 的 两 个 方面 的 成 果 一 - 基 
于 随机 化 的 设计 与 基于 正 态 假定 和 zt. 下 等 分 布 的 检验 理论 完满 地 
结合 起 来. 

可 是 费 歌 尔 当时 尚 不 能 对 这 两 个 作法 的 一 致 性 给 出 理论 的 证 
明 . 其 证 明 的 基础 在 于 线性 置换 统计 量 的 极限 理论 . 这 个 理论 发 端 
于 1940 年 代 瓦 尔 德 与 沃 尔 夫 维 奇 的 工作 ,并 经 诺 特 , 龙 其 是 1960 
年 代 捷 克 学 者 哈 耶 克 的 努力 ,达到 完善 . 因而 也 证 明了 上 述 两 种 帮 
法 在 大 样本 下 的 闭 近 一 致 性 . 在 拙 著 《 数 理 统计 引 论 } 第 六 章 中 ,对 
这 一 切 有 详细 的 论述 . 


卡尔 *， 此 尔 避 的 氢 侣 优 更 检验 与 费 软 尔 的 显著 性 检验 ,一 者 
的 对 象 不 同一 一 一 是 针对 分 布 , 一 是 针对 一 个 效应 + 通常 是 数值 , 
但 二 背 的 思路 和 和 恬 法 很 一 至 :都 是 要 找 出 一 种 能 衡量 数据 与 假设 
的 帆 差 的 量 , 并 用 其 福 率 ( 拟 合 优 庆 和 显著 性 水 平 ) 来 衡量 假设 是 
和 次 直行. 因此 ,在 这 二 位 大 师 学 术 上 的 诸多 分 歧 中 ,惟有 假设 检验 
这 一 项 ,二 大 之 阿 没 有 作 过 什么 批评 . 对 费 琢 尔 显 著 性 检验 理论 的 
不 同意 抑 来 有 具 贝 叶 期 堂 派 , 主 要 有 两 条 :一 是 针对 费 软 尔 * 微 试验 
的 唯一 自 的 是 搜集 刘 零 假设 不 利 的 证 据 ”"、“ 零 假设 只 能 被 否定 不 
能 被 证 实 " 这 类 的 说 法 ,认为 这 样 一 来 , 零 假 设 等 于 是 一 个 被 捆 住 
的 活 靶 子 , 总 有 被 击 中 的 一 天 . 公平 地 说 , 费 软 尔 这 些 说 法 从 字面 
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看 是 绝对 化 了 一 些 , 好 在 费 融 尔 本 人 也 和 作 过 一 些 解释 ,例如 说 不 
能 根据 单一 的 试验 结果 来 否定 零 假设 ;在 实际 运用 中 ,一 个 重要 的 
零 假 设 也 许 会 有 多 人 去 检验 它 , 将 其 结果 作 纤 全 分 析 , 可 以 得 到 更 
现实 的 评 佑 , 这 蛙 重 要 的 是 对 数据 分 机 结果 的 解释 要 慎重 ,通常 还 
要 与 问题 相关 的 专业 知识 和 经 验 联 系 起 来 考察 . 
轧 一 个 批评 是 ;显著 性 检验 中 的 零 假 设 往往 有 8=0 这 类 形 
起 :但 8 不 可 雇 绝 对 地 为 0; 鼓 这 假设 天 生 就 是 错 的 . 册 呈 斯 派 主 
张 , 要 人 么 把 8 二 0 换 成 更 现实 的 18| 志 ,se 汪 0 为 革 选 定 值 ,而 对 4 给 
一 先 验 分 布 ,要 么 仍 维持 8 一 0, 但 对 这 一 点 ( 即 0) 给 一 个 正 的 先 验 
概率 . 这 不 失 为 一 种 赫 代 的 做 法 ,但 以 此 批评 零 假设 8 一 0 之 不 合 
理 , 则 仍 是 表面 上 的 . 雹 为 ,尽管 在 理论 上 严格 标明 了 假设 是 8 一 


0 ,但 所 用 检验 ,实际 上 并 未 执着 于 这 一 点 . 比如 说 当 |L 足 够 小 时 


我 们 接受 9 一 0, 如 果 19| 昌 不 为 0 但 相当 小 , 则 “| " 足 驶 小 仍 能 


维持 . 层 有 除非 样本 措 非 常 大 (而 一 般 在 人 人 工控 制 的 试验 中 ,这 种 情 
帝 不 大 有 ), 不 太 可 能 发 生 这 种 情况 :18| 很 小 ,实际 上 可 以 认为 是 
0 即 这 个 效应 没有 实际 意 久 ), 但 383 值 不 为 0, 面 在 答 验 中 原 假 设 上 5 
-0 被 但 定 了 . 这 类 检验 法 经 过 实用 者 的 长 期 使 用 ,并 没有 从 他 们 


那里 听 说 由 于 零 假设 提 法 上 的 不 合理 而 在 实用 上 带 来 不 恒 , 就 是 
一 个 证 明 . 


《9.3 条 曼 和 皮尔 过 的 故事 


这 里 民用 了 爱 根 ， 皮 尔 避 写 的 一 篇 文章 #kThe Neyman-Pear- 
son Story :1926 一 1934» 的 题 上 自 ,文章 刊 截 于 他 与 此 德尔 合 编 的 六 
集 ¢ 概 率 统 计 史 研究 》,1970 年 内 版. 文中 回忆 了 他 与 率 卓 的 个 大 
芭 往 及 合作 建立 假设 检验 理论 的 往事 . 他 们 二 人 也 因 这 项 成 就 而 
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副 人 20 世纪 毁 计 学 发 展 的 史册 , 对 这 曼 而 言 ;除了 此 项 成 就 外 , 另 
一 项 广为人知 的 有 基本 意义 的 成 就 ,是 在 1930 年 代 建 立 的 置信 区 
间 理 论 . 

妆 根 ". 友 久 进 (Egon Sharpe Pearsons1895 一 1980) 的 经 历 比 
较 简 单 . 年 轻 时 有 妈 亿 和 随 其 父 学 习 和 研究 统计 学 . 待 奈 曼 1925 年 秋 
到 大 学 学 院 参 加 卡尔。 上 友和 尔 避 主持 的 赋 究 生 班 时 , 爱 根 在 班 上 协 
助 其 冬 任 辅导 ,后 来 到 1933 年 卡尔 。 皮 尔 逊 退休 并 将 其 职务 一 分 
为 二 时 , 爱 根 接替 了 其 统计 系 主 任 的 工作 直至 退休 ， 

据说 他 为 人 性格 比较 内 向 ,不善 与 人 交往. 在 当时 统计 界 各 流 
中 ,惟有 Student 与 他 保持 良好 的 关系 .他 1925 年 开始 与 Student 
通信 以 来 , 池 售 往来 一 直到 Student 去 世 的 1937 年 . 他 很 到 帘 这 
份 友 造 ; 临 去 志 前 两 年 他 还 在 编辑 他 与 Student 的 往来 信件 , 共 百 
人 针对 ,其 中 包 会 了 不 少 这 段 叶 期 有 闫 统计 学 的 珍贵 史料 . 

费 葡 未 当时 接 兰 了 卡尔 + 皮尔 逊 的 另 -- 半 职务 :高 尔 登 优生 
学 讲座 教授 ,与 爱 根 同 在 --- 座 楼 的 相 邻 两 层 . 费 砍 尔 对 这 一 安排 并 
不 洲 意 ,因为 他 认为 ,他 自己 是 同时 继承 这 两 大 职务 的 惟一 适当 人 人 
选 .但 二 人 在 学 术 观 点 和 其 他 方面 也 未 曾 有 过 严重 的 冲突 或 失 和 ， 
实际 上 目 1920 年 代 中 期 起 , 爱 根 已 背离 了 其 父 的 那 一 套 大 样本 统 
计 , 转 而 妇 到 费 加 尔 的 小 样本 底下 . 历史 事实 表明 ,他 这 一 立场 的 
和 巷 恋 ,是 他 日 后 在 开创 和 假设 检验 理论 方面 取得 巨大 成 就 的 根源 . 他 
与 条 上 辟 的 交往 始 于 1925 年 秋 奈 曼 前 去 大 学 学 院 就 学 于 卡尔 。 颇 
尔 避 时 ,这 经 历 只 有 一 年 .1926 年 至 1934 年 期 间 秦 学 不 长 住 黄 
国 ,1934 年 条 曼 来 大 学 学 院 工 作 至 1938 年 去 美 . 尔后 二 人 天 各 一 
方 , 见 面 很 少 . 全 与 这 届 的 合作 那 8 个 年 头 二 人 正 不 在 一 处 ,主要 
依 菲 通信 及 因 学 术 会 议和 旅游 度 仿 等 的 短暂 会 面 . 

比 起 爱 根 ， 皮尔 带 来 , 守 曼 (Jerzy Neyman,1894 一 1981) 的 经 
历 就 显得 复杂 多 样 了 . 他 1894 年 出 生 在 心 国 临 近 团 马 尼 亚 的 杰 宾 
里 . 1912 年 举 察 迁 至 哈 尔 科 夫 , 当 年 进入 哈 尔 科 夫 大 学 学 习 数 学 
和 物理 . 在 这 里 一 件 对 他 一 生 有 重大 影响 的 事件 ,是 他 昕 了 当时 著 
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名 概率 学 者 怕 思 斯 坦 的 讲课 . 他 在 年 轻 时 即 对 纯 数 学 有 强烈 的 兴 
趣 并 有 很 高 的 素养 ,与 们 恩 斯 坦 等 名 师 的 节 陶 有 关 . 这 对 他 日 后 研 
究 数 理 统 计 学 的 风格 留 下 了 了 印记， 

1921 年 他 根据 一 战 后 的 里 加 条 约 , 作 为 交换 移民 随 家 寺 往 波 
兰 , 自 此 和 他 成 为 一 位 波兰 公民 ,1957 年 他 回 他 的 祖国 波兰 访问 ,在 
华沙 的 科学 文化 宫 作 讲演 . 笔者 当时 适 在 波兰 进修 ,在 报告 厅 见 到 
了 他 .这 是 影响 了 20 世纪 统计 学 发 展 进程 的 少数 兄 位 大师 中 , 笔 
者 有 幸 亲 了 眼 丰 于 的 惟一 的 一 位 ,其 谊 谈 举 止 凤 艇 至 今 仍 在 脑海 中 
留 下 了 深刻 的 印象 . 

到 波兰 后 ,守明 接受 他 哥 如 的 建议 ,去 披 得 奇 什 和 的 国立 农业 学 
院 申 请 上 作 :, 任 高 级 统计 助理 ,这 是 他 统计 生 潍 的 开 贻 . 1925 年 得 
到 政府 资助 去 卡 条 "上 度 尔 于 那里 深造 ,在 这 期 间 经 Student 介绍 ， 
于 1926 年 7 月 会 见 了 费 歌 和 尔 . 他 在 卡尔 ， 诡 尔 进 那里 果 了 一 年 ， 
于 1926 年 秋 因 雍 兄 非 勒 基金 的 资 妥 ,在 巴黎 进修 了 一 年 . 据说 他 
网 开 太 学 学 院 的 原因 是 对 那里 的 统计 学 表示 失望 ,认为 没有 人 多少 
数学 . 由 此 春来,; 候 这 种 重视 统计 学 中 数学 严格 插 的 观点 ;是 早已 
形成 并 终 其 一 生 一 以 贯 之 的 . 

在 中 歼 期 间 他 昕 过 勒 维 、 勒 贝 格 和 被 莱 尔 这 些 太 师 的 讲课 ,对 
他 影 啊 很 大 . 此 后 二 到 1934 年 ,他 绝 大 部 分 时 间 在 波兰 任职 ,与 爱 
撒 的 合作 研究 就 在 这 段 时 间 . 1934 年 再 去 大 学 学 院 任 教师 ,到 | 
1938 年 4 月 说 美 国 般 州 信 充 利 大 学 数学 系 之 聘 去 该 系 任教 授 . 这 
一 事件 对 美国 统计 学 的 发 展 , 以 及 对 他 自己 ,都 是 一 个 转折 点 . 这 
中 间 过 球 到 他 与 间 砍 和 尔 的 歼 盾 ,使 他 感到 在 英国 难于 发 展 , 商 美国 
则 证 一 个 新 天 地 ,他 大 有 发 展 自 己 才 王 的 余地 . 

1930 年 代 后 期 的 美国 统计 学 与 英国 相 比 , 尚 属 * 第 三 世界 ”的 
性 奈 . 加 州 人 克利 大 学 当 冉 的 数学 系 主任 埃 文 斯 是 一 个 很 重视 关 
用 数学 的 人 ,也 了 解 统计 学 的 重要 性 .学 校 当 局 在 他 的 建议 下 着 手 
自问 国 引 进 一 位 统计 界 重量 级 人 人 物 来 如 大 数学 系 . 当时 考虑 了 所 
括 费 黑 尔 及 其 弟子 在 内 的 一 些 人 ;最 后 眼光 锁定 在 这 有 曼 饼 上 .在 这 
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里 除了 其 他 一 些 因 素 外 , 奈 曼 关于 在 统计 学 中 坚持 严谨 数学 的 主 
张 起 了 一 定 的 作用 ,因为 埃 文 斯 主张 严谨 的 统计 学 是 数学 的 一 个 
组 成 部 分 . 顺便 说 一 句 , 埃 文 斯 的 这 种 观点 也 使 达 晶 关于 在 加 大 妇 
立 统 计 系 的 主张 推迟 到 1955 年 才 实 现 , 虽 然 加 大 的 统计 实验 室 早 
就 起 到 了 系 的 作用 . 这 个 实验 室 是 奈 上 党 到 可 大 工作 不 义 , 于 1938 
年 建 守 的 , 它 在 二 战 后 逐步 取代 伦敦 大 学 学 院 的 统计 系 , 成 为 国际 
统计 学 的 主要 中 心 . 

奈 曼 不 负 众 望 ,很 块 把 如 大 建设 成 美国 的 一 个 主要 的 统计 中 
心 ,与 东海 岸 的 哥伦比亚 大 学 双 峰 对 峙 . 他 大 力 抓 入 才 队 伍 建 设 ， 
据说 有 一 个 时 期 ,统计 实验 室 的 研究 生 数 目 占 旬 加 大 全 部 研究 生 
数目 的 将 近 一 半 . 在 他 周围 集结 了 一 批 新 秀 ,其 中 有 勘 康 、. 莱 有 曼 . 斯 
坦 因 、 邯 莱克 威 尔 和 王 非 等 后 来 成 为 美国 统计 界 重 量 级 的 人 物 . 自 
1945 年 开始 他 主持 了 多 届 从 克利 国际 概率 统计 讨论 会 ,对 推动 国 
际 上 统计 学 的 研究 和 国际 统计 学 术 交 流 起 了 重大 的 作用 ， 

这 里 想 特 别提 到 他 与 我 国 车 名 统计 学 家 许 宝 又 先生 的 一 段 关 
系 . 许 在 二 战 后 曾 在 加 大 这 上 晕 手 下 工作 过 一 段 短 时 期 . 奈 曼 对 许 极 
为 器 重 , 曾 为 许 的 职称 问题 大 声 疾 呼 . 后 来 许 去 北 卡 大 学 工作 , 夺 
曼 还 曾 去 看 过 他 , 想 把 他 争取 回 自己 的 旗下 ,但 许 于 1947 年 回国 
在 北大 任教 . 据说 在 那 以 后 他 还 多 次 对 许 的 状况 表示 美 心 ， 

对 于 蛮 曼 移居 美国 对 美国 统计 学 发 展 的 影响 ,也 有 些 另 一 曾 
的 看 法 ,主要 是 认为 他 倡导 了 统计 学 研究 和 教学 中 的 纯 数 学 倾向 . 
持 这 种 看 法 的 有 受 英国 统计 学 传统 影响 很 深 的 一 部 分 美国 统计 学 
界 元 老 , 费 葡 尔 本 人 也 持 这 种 看 法 也 不 过 ,如 果 说 战 后 美国 统计 
学 确 然 存在 所 说 的 烦 向 , 那 合 不 是 体现 在 奈 曼 本 人 身上 . 他 领导 的 
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4 这 里 摘 引 费 网 尔 嘉 儿 为 她 父亲 写 的 传记 中 的 一 笑话 :* 案 又 和 瓦尔 大 在 1939 
入 1940 年 移居 美国 . 在 教学 中 ,统计 的 理论 和 数学 太 面 日 益 受 到 强调 . 美国 统计 学 家 
的 入 度 有 了 改变, 这 煌 灭 了 在 1936 年 费 歌 尔 来 访 时 看 到 的 曾 使 他 很 高 兴 的 屠 种 热情 . 
当 他 : 费 歌 尔 31946 年 重 访 美 国 时 ,年 轻 统计 学 家 确 热 把 他 作为 一 个 权威 来 欢迎 , 担 局 
时 也 把 他 看 作 一 个 卫生 人 ,他 的 想法 和 王 法 已 不 再 符合 他 们 的 关口 -> 
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实验 室 在 战 时 曾 受 军 方 的 委托 研究 过 与 战争 密切 相关 的 问题 ,成 
后 也 从 事 过 多 方 罕 的 有 实际 意义 的 重要 谋 题 . 


下 面 转 到 正题 . 他 们 二 人 的 合作 大 体 上 可 分 成 两 个 阶段 ,以 
1930 年 初 为 界 . 前 期 起 主导 作用 的 是 爱 根 , 而 后 期 则 是 奈 曼 . 特别 
是 ,提出 这 个 问题 的 最 初 想法 是 来 自爱 根 . 这 一 点 看 来 甚 合 情理 : 
毕竟 爱 概 与 统计 党 打交道 的 时 间 比 床上 长 得 多 ,而 夺 曙 又 是 一 个 
比较 专注 于 统计 问题 的 数学 方面 的 人 人 . 但 后 期 的 进展 主要 是 厅 骂 
之 力 . 

爱 根 思考 到 这 方面 的 问题 与 但 当时 转 癌 小 样本 的 大 环 碟 有 
关 , 困 为 正 是 小 样本 理论 提供 了 处 理 同一 问题 的 客 种 方法 且 有 形 
场 的 概率 计算 可 资 比较 , 他 因此 思索 这 样 的 问题 ;可 不 可 以 制定 某 
此 原则 以 指导 这 种 选择 . 我 们 知道 ,这 正 是 卡尔 。 皮尔 还 和 费 歌 外 
的 假设 检验 工作 中 没有 考虑 的 问题 ,他 们 只 基 对 确定 的 问题 提出 

-种 看 来 合理 的 检验 法 . 

爱 根 在 回忆 文章 中 , 提 及 当时 对 他 思考 有 影响 的 学 者 有 2 人 . 
其 一 是 办 德 斯 ,他 在 1924 年 发 表 了 一 篇 题 为 g 关 于 两 组 样本 是 否 
来 自 同一 总 体 的 问题 } 的 文章 , 考 砷 了 2X 列 联 表 . 处 理 这 问题 的 
一 逢 方法 已 由 卡尔 *， 皮 尔 避 给 出 ,但 罗 德 斯 在 文章 中 说 ,很 显然 ， 
性 在 着 许多 检验 这 问题 的 方法 ,在 逮 缉 上 同样 有 根据 . 他 提出 .在 
这 种 场合 下 应 当 用 最 严 的 (most stringenty， 即 给 出 最 小 尾 概 率 的 
检验 . 爱 根 说, 正 是 这 一 提 法 在 他 心中 引起 了 许 儿 问题 和 疑问 ;他 
再 始 在 过 维 的 样本 空间 中 比较 不 同 检验 的 否定 域 , 看 是 否 能 找到 
什么 在 直觉 上 有 吸引 力 的 原则 ,以 指导 对 这 些 和 否定 域 的 选择 . 

太一 个 对 他 有 影 啊 的 学 痢 是 Student. 1926 年 春 , 爱 根 疝 他 写 
信和 请 教 关 于 用 他 的 上 统计 划 去 检验 正 态 均值 的 合理 性 . Student 在 
国信 中 指出 ,否定 一 个 统计 假设 的 惟一 正当 理由 是 ,存在 另 一 个 假 
设 , 它 能 以 更 太 的 概率 解释 观察 到 的 样本 .这 “ 筋 一 个 假设 ”现在 我 
们 称 之 为 对 立 依 设 或 备 择 很 设 , 这 可能 是 仿 设 检 验 史 上 首次 提出 
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这 个 重要 概念 . Student 并 举例 解释 道 ; 逢 你 检验 一 个 正 态 分 布 的 
均值 a 二 ao 而 发 现 |zr 一 ao | 二 cc, 其 概率 ( 指 概 率 已 (| 工 一 ao | 之 
一 一 -| 者 ) 韭 常 小 ,和 例如 只 有 10 ', 这 也 不 能 证 明和 你 的 样本 不 是 
来 自 a 二 a 的 正 访 分 布 .但 如 有 菇 一 个 可 民选 择 之 值 ma, 它 使 PU 
一 | 六 中 比方 说 等 于 0.05, 则 你 必 会 非常 癸 向 于 认为 , 奈 来 的 
假设 二 wo 可 能 不 真 . 
到 1926 年 末 , 爱 根 把 在 心中 酝 恒 已 久 的 想法 写 信 告诉 秦皮 ， 
这 是 他 全 合作 的 第 一 短文 章 的 大 网 ,其 中 包括 两 类 错误 .控制 第 一 - 
类 错误 的 原则 . 备 择 眼 设 以 及 似 然 比 .此 文 于 1928 年 发 表 在 4 生物 
汗 量 》 杂 志 上 ， 
他 提 册 似 然 比 检验 ,与 费 歇 尔 1912 年 所 作 极 夫 似 然 知 计 的 文 

章 的 影 唤 有关 ,但 主要 恋 怕 是 他 通过 此 法 对 一 些 重要 人 酌 子 的 应 用 
而 各 标的 信念 ,认为 这 可 以 作为 选取 一 个 良好 检 驼 的 方法 , 奈 曾 对 
位 然 比 开始 并 不 热心 ,他 觉得 此 法 隐 会 了 对 贝 叶 斯 原则 的 使 用 ,说 
与 其 如 此 ,还 不 如 直接 给 参 数 以 某 种 先 答 分 布 了 ,但 后 来 他 有 保留 
地 接 党 了 索 根 的 想法 . 紧 接 着 他 们 叉 合 作 写 了 一 往 关 于 骸 然 比 检 
验 的 文章 , 文 题 与 第 一 篇 同 呈 也 是 在 1928 年 发 表 在 4 生物 计量 》 
上 .此 文 用 似 热 比 检验 的 观点 研究 了 卡尔 ， 皮 尔 挝 站 拟 合 优 度 检 
骏 促 参数 的 情形 ,用 一 种 见 何 表述 法 ,清楚 好 看 到 费 歇 尔 提 出 的 关 
于 县 由 度 的 修改 . 奈 紧 写 了 一 个 附录 包含 此 事 的 严格 证 明 . 在 

1928 年 一 1930 年 期 间 ,他 们 二 大 合作 以 爱 根 为 主 , 斌 究 了 两 样本 

问题 儿 儿 样本 问题 的 似 然 比 检 验 . 两 样本 问题 提 法 为 : 设 里 |,，…， 
sm 和 站, 了 分别 是 抽 自 正 态 总 体 Neal ya 和 (eyes 中 的 
随机 样本 ,al yeas? 了 ,7 全 部 未 知 , 要 检验 假设 
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人 了 他们 导出 了 似 然 比 统计 量 ,并 证 明了 当 羔 和 > 都 很 大 时 ， 


HU 对 缀 成 名 后 一 直 是 一 个 坚定 的 技 贝 叶 斯 主义 的 人 , 他 在 这 里 的 想 共 表明 ,在 
1926 年 时 他 还 惟有 对 内 了 时 斯 访 采 联 胃 确 的 反对 立场 . 
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一 2log4 在 原 假 设 成 立 的 前 提 下 渐 近 于 分 布 六 ,这 是 1938 年 由 威 
尔 克 斯 43.S. Wilks} 所 证 朋 的 有 关 伺 然 比 极限 分 布 定理 的 一 个 特 
例 . 他 们 关于 两 样本 和 和 名 样 本 的 合作 论文 ,是 分 别 于 1930 条 1931 
年 在 被 兰 刊 物 上 发 表 的 . 

从 以 上 描述 可 坟 看 出 :他 们 合作 的 第 一 期 的 主要 成 果 是 似 然 
比 检 验 ; 作 为 夺 上 坚 一 皮尔 进 理 论 的 核心 的 那些 内 容 尚 未 出 更 , 那 是 
第 二 期 (1930 一 1934) 合 作 的 成 果 . 在 这 一 阶段 ;重心 转 到 索 曙 这 
由. 他 之 所 以 担当 了 这 个 任务 ,一 是 由 于 他 对 似 然 比 存 在 的 保留 态 
度 ,这 便 他 不 像 爱 根 那 样 把 侯 然 比 看 成 终极 的 结 虹 ,好 还 是 存在 可 
下 的 问题 :或 者 证 明 侯 然 比 检验 在 基 种 意 交 上 为 最 优 ,或 者 设法 和 找 
出 最 忧 榨 验 . 正 是 对 这 个 间 题 的 探索 使 他 发 现 了 著名 的 “基本 引 
理 " 太 一 致 最 优 检 验 等 中 心 内 容 . 二 是 他 的 数学 根 底 及 倾向 性 强 过 
爱 根 ,这 在 下 一 步 基本 上 是 纯 理 论 的 三 究 中 十 分 重要 . 

这 个 阶段 可 以 说 起 始 于 1930 年 3 月 8 日 .在 这 一 天 泰 曼 给 爱 
根 写 了 一 封 信和 ,提出 5 个 当前 有 待 钱 究 的 问题 ,其 中 之 一 是 : 检验 
第 2 类 错误 概率 的 计算 . 索 坚 后 来 把 这 叫 微 功效 联 数 ,这 是 将 这 一 
里 要 概念 引入 假设 检 验 之 始 , 另 一 个 问题 是 一 个 所 请“ 一 般 的 变 分 
学 问题 . 

此 和 癌 有 题 是 这 么 一 同事: 虽然 他 们 的 研究 证 崩 了 似 然 比 是 一 个 
有 用 的 检验 ,但 它 仍 具 是 一 个 在 直观 上 看 来 有 吸引 为 的 检验 ,需要 
可 求 某 种 理论 上 的 根据 . 在 对 待 这 一 问题 上 , 爱 根 和 达旦 走 的 路 线 
不 同 . 

爱 根 他 宙 于 利用 在 大 学 学 院 积累 的 生机 抽样 资料 来 作 宰 拟 比 
较 . 他 对 检 验 正 态 分 布 均值 (方差 来 知 ) 为 内 的 根 设 比较 了 两 个 检 
验 , 其 一 是 Student 上 检验 , 另 一 是 基于 统计 量 

1 一 (T1200) 
(Ty OL 
的 检验 ,其 中 工 ; 和 和 ;分别 是 个 样本 值 中 的 最 小 和 最 大 者 . 他 的 
模拟 结果 显示 , 当 总 体 分 布 由 均 义 分布 向 长 尾 分 布 过 渡 时 ,z 检验 
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的 优越 性 逐 洒 显著 . 爱 根 记 为 ; 虽 到 所 得 结果 尚 晤 粗粮, 但 也 指明 
了 :把 注意 力 集中 在 功效 落 数 上 是 合 理 的 . 

泰 曙 则 从 更 根本 的 立场 出 发 , 即 从 数学 的 人 第 度 去 考察 ;为 使 接 
芝 一 个 "不 对 的 假设 "的 概率 最 小 ,也 即使 否定 它 的 概率 最 大 ,检验 
该 是 什么 形状 .他 在 对 村 这 个 问题 时 碰 到 了 相当 的 困难 , 据 爱 根 回 
忆 , 只 是 由 于 坚持 不 懈 的 精神 保证 了 最 后 的 成 功 . 长 话 短 说 ,到 
1931 年 秋 ,. 牵 汉 已 完成 了 基本 的 研究 .得 到 "基本 引 理 * 和 一 致 最 
优 LUMP) 检 验 的 基本 理论 . 1931 年 末 二 人 在 华 认 会 面 商 定 了 题 
为 &《 关 于 统计 假说 的 最 有 效 检 验 问 题 } 的 合作 论文 . 此 文 在 1932 年 
8 有 睛 经 卡尔 。， 站 外 进 推荐 给 皇家 学 会 .由 划 砍 和 尔 审阅 ,于 1933 年 
发 表 , 这 就 是 我 们 现在 通称 和 的 奈 曼 一 皮尔 还 理论 的 莫 基 性 工作 . 

此 文 发 表 后 ,他 们 二 大 这 一 段 8 年 合作 的 敌 事 也 走向 落幕 局 ， 
虽然 1934 年 条 曼 来 伦敦 与 爱 祖 在 同一 单位 工作 . 自 此 至 1938 年 ， 
他 们 和 他 们 的 研究 生还 共同 研究 过 一 些 问题 ,但 已 不 像 前 一 段 那 
样 有 一 个 明确 的 计划 . 后 期 二 大 共同 发 表 的 论文 中 ,重要 的 有 发 表 
于 1936 和 1938 年 的 # 对 假 谨 检 验 理 论 的 贡献 》, 其 中 引进 了 无 偏 
检验 和 一 致 最 优 无 恬 裕 验 的 概念 . 这 方面 的 研究 根 源 可 以 过 潮 得 
更 于 .问题 是 这 样 的 :在 前 一 段 研 究 中 已 明确 ,在 简单 假设 的 情况 
UMP 检验 存在 且 就 是 做 然 比 检验 . 但 在 复合 假设 情 兹 下 . 虽 则 已 
可 造 其 做 然 比 检验 , 候 不 一 定 是 UMP ,这 一 点 促使 他 们 在 其 
1933 年 文章 中 引进 “相似 检验 ”的 福 念 , 即 把 所 考虑 的 检验 范围 缩 
小 ,这 个 在 无 仿 检 验 的 研究 中 是 一 个 关键 的 福 念 . 另外 在 1931 年 ， 
就 一 个 特 俩 泰 曼 已 接 角 到 非 无 偏 检验 , 虽 则 当时 还 没有 引进 这 个 
名 称 . 问题 是 由 正太 Ca:o)ga as 都 未 知 } 中 抽出 的 样本 去 检验 
假 这 ia 一 0 一 1). 奈 曼 算出 , 似 热 比 检验 在 < 一 0,a 一 1.1 处 的 功 
获 小 于 检验 的 水 平 . 后 来 到 1955 年 , 莱 坚 与 衣 菲 合作 ,在 {完全 性 、 


9 只 二 人 合作 论 立 发 表 的 时 间 看 ,最 时 一 阐 是 1928 年 而 最 未 一 篇 是 1938 年 , 可 
是 才 根 在 其 % 祭 曼 与 度 尔 各 的 故事 :1926~-19343 一 文中 ,把 和 他们 二 人 人 癌 寿 的 时 亲 明 确 
堆 圣 1934 年 赴 ， 、 


2 


相 亿 区 域 与 无 往 逢 计 J3 一 文中 ,发 展 了 指数 族 分 布 参数 一 臻 最 优 无 
仿 检 验 的 理论 . 

后 批 对 率 达 一 皮尔 避 理 论 的 评价 很 高 .1978 年 , 当 床 曼 传 记 
的 作者 问 他 是 否 把 二 人 合作 在 数理 统计 学 上 导致 的 革 全 看 成 一 场 
“ 准 哥 白 尼 半 傅 "时 ,他 承认 “在 一 定 程度 上 是 的 … 

这 个 理论 的 巨大 影响 ;不 在 于 它 提 供 了 一 批 在 实际 中 有 用 的 
检验 -一 - 它 在 这 方面 的 建树 其 实 有 限 . 即使 似 然 比 栓 验 是 一 个 应 
由 很 广 航 方法 ,但 它 实用 的 最 重要 情况 共 实 还 是 Student、 筑 歌 尔 
等 已 用 其 他 方法 得 出 的 ,UMP 检验 也 只 在 有 限 的 情况 存在 且 大 
部 是 已 知 的 检验 . 

它 的 忆 太 意义 在 于 作出 了 一 个 样板 ,和 而 指导 和 影响 了 统计 
学 以 后 的 发 展 方 向 . 自 有 统计 学 以 来 , 破 天 荡 第 一 次 在 一 个 重要 领 
域 把 其 基本 概念 和 所 要 解决 的 问题 严格 地 用 数学 表达 出 来 ,; 即 把 
统计 问题 的 解 化 光一 个 数学 量 优 化 问题 ,十 余年 后 ,瓦尔 乱 
(Abraham Wald,1902~1950}) 把 这 一 想法 推展 到 整 个 的 数理 统计 
学 领域 ,建立 了 统计 决策 函数 理论 . 对 统计 学 的 理论 研究 和 应 用 都 
产生 了 相当 六 的 影 啊 . 调 本 寻 源 ,有 充分 的 理由 认为 奈 达 一 皮尔 运 
理论 是 瓦尔 德 的 建 论 的 先 声 .无 沦 如 何 , 案 晕 一 皮尔 人 进 的 工作 成 了 
那 以 后 严 间 的 统计 理论 研究 工作 的 一 个 模式 .这 一 点 在 数理 统计 
学 另 一 重要 分 支 一 一 参数 人知 计 中 ,看 得 最 为 明显 . 

这 样 一 个 变化 的 后 末 如 和 何 呢 ?这 是 一 个 免 仁 匈 智 的 问题 , 确 有 
不 少 统计 学 家 认为 ,二 战 后 统计 研究 中 过 分 的 数学 化 倾向 造成 了 
理论 与 应 用 的 脱节 ,造成 了 空 润 无 物 的 文章 泛 灌 的 情况 ,这 不 能 不 
说 是 实情 . 但 是 应 该 看 到 :对 晏 一 上 应 尔 避 的 假 旭 检验 理论 是 有 用 的 
理论 , 且 在 统计 研究 中 提倡 严谨 的 数学 本 身 也 不 能 说 有 错 ,一切 要 
看 实际 如 何 运 用 .不 能 把 奈 曼 和 皮条 吉 的 后 来 人 中 所 存在 的 一 些 
民 误 个 向 归 符 于 他 们 . 


$9.4 许 宝 又 教授 的 贡献 


许 宝 驿 (1910 一 19707 祖 籍 杭 州 ,1910 和 年 9 月 1 日 出 后 于 北 
更 ,先后 在 首 京 大 学 和 清华 大 学 忒 讯 化 学 和 数学 ,毕业 后 在 北京 大 
学 任教 . 1936 年 起 英 留 学 学 习 统 计 学 ,1940 年 回国 执教 于 西南 联 
大 . 1945 年 盐 凌 ,先后 在 介 克 简 加 州 大 学 .哥伦比亚 大 学 和 北 卡 大 
学 : 任 访 门 教授 .1947 年 10 月 回国 任 北 大 教授 至 1970 征 12 月 18 
HH 去世. 

主 先 生 在 数理 统计 和 概率 论 领 域 的 成 就 是 名 方面 的 ,这 里 只 
结 侣 本 童 主题 介 绍 一 点 他 在 假设 检验 方面 的 成 就 . 先 得 说 说 1930 
年 代 后 期 当 许 先生 开始 其 研究 工作 时 ,数理 统计 学 面临 的 热点 问 
是 . 

当时 奈 曼 一 度 尔 逊 的 假设 检验 理论 刚刚 建立 ,但 还 未 能 应 用 
到 比较 复 条 的 模型 中 去 ,其 中 最 重要 的 是 线性 统计 模型 . 另 一 方 
面 ,上 圣 在 十 人 条 年 前 赣 砍 尔 等 已 对 线性 模型 的 线性 假设 发 展 了 下 检 
验 . 这 种 检验 是 基于 直观 ,不 知道 它 有 何 优越 性 或 是 否 有 比 它 更 优 
越 的 检验 . 在 没有 祭 虹 一 皮尔 吉 理 论 时 ,这 种 问题 无 从 提出 , 即 或 
提出 也 无 从 下 手 . 现在 奈 曼 一 皮尔 按理 论 建 立 了 以 比较 功效 了 消 数 
为 基础 的 方法 .为 此 ,把 这 一 方法 用 于 线性 模型 的 线性 假设 检验 问 
题 *《 当 然 世 包括 Student 检验 在 内 }), 是 一 个 很 有 意义 的 研究 方向 ， 
因为 这 些 检验 在 应 用 上 有 写 大 的 重要 性 . 但 这 种 研究 率 涉 到 很 复 
来 的 精细 分 析 问 题 , 面 在 当时 的 统计 学 家 队伍 中 ,具备 这 种 数学 素 
养 的 ,为 数 还 很 少 , 许 先生 正 是 其 中 的 突出 者 .他 又 及 时 敏锐 地 抓 
这 个 册 究 方向 ,取得 了 有 重要 意义 的 成 就 . 以 下 介绍 几 简 他 在 这 
个 领域 中 的 代表 作品 . 

1.《student 1 分 布 理 论 用 于 两 样本 问题 》. 
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此 文宏 表 于 1938 年. 设 -11 3 ”过 1 有 Tan 分 别 从 星 


正 态 分 布 六 Cat:a2) 和 assas 妆 中 提出 的 随机 样本 ,atyasyar az 
部 未 知 . 许 持 生 考 虑 了 以 下 几 个 检验 问题 : 

A.al=a 0 0 

Bi. a, Ca. 

C.a 二 a:; 假 是 5. 二 go 公共 值 未 向). 

问题 A 在 杂 坚 和 爱 寝 *， 皮尔 过 1930 年 文章 & 关 于 两 梓 本 检 
验 》 中 讨论 过 ,他们 求 得 子 似 然 比 检验 ,但 对 其 性 质 未 作 深 和 人 讨论. 
问题 芋 是 着 名 的 贞 伦 斯 - 费 葡 和 泵 问题 .至 于 局 题 忆 :已 击 费 歇 不 在 
其 1925 年 文章 《Student 1 分 布 的 应 用 》 中 讨论 过 ;他 引进 了 沿用 
至 今 的 两 梓 本 :1 检验 .但 也 未 能 仔细 探 容 其 表现 , 特 草 是 在 作为 册 
发 点 的 假定 9 二 52 不 对 时 ,会 有 如 何 的 后 果 . 

人 


一 A 


许 先 生 引 进 中 全 计量 

CT Oi) 
{AALS 二 站 52》 
其 中 41 计 0,A: 广 0 为 常数 ,而 考虑 以 1a|>c 为 否定 域 的 检验 .这 
包含 了 当时 在 讨论 这 些 问题 时 引进 过 的 一 些 检 验 . 例如 , 当 4 一 
1 时 得 到 两 样本 1: 检验 . 

这 个 工作 的 重头 部 分 是 计算 上 述 检验 的 功效 函数 , 即 
站 有 一 天 [| 和 | cla sas soa: ,0 ), 


2 一 


这 里 一 = 和 十 和 容易 看 出 ,这 功效 函数 
只 是 通过 1 和 和 中 这 两 个 参数 而 优 款 avusyc ,0. .和 作 这 个 计算 的 目 
的 ,是 所 以 研究 这 个 检验 在 种 种 情 慈 下 的 表现 . 例如 , 当 两 样本 
检验 用 于 问题 已 时 ,表现 如 何 . 下 表 是 许 先 生计 算 的 部 分 结果 ; 
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原 假 设 a 二 a; 成 立时 上 检验 功效 函 妆 有 8 信之 值 


corlo) 


此 检验 水 平定 为 0.05. 表 中 (5,15) 表 示 机 二 5y1;y 二 15, 爹 类 推 .这 
个 计算 的 吕 的 是 和 钼 明 在 问题 CC 中 ,着 假 定 9 一 ov:( 即 8 一 21) 不 对 
时 ,会 有 如何 的 后 困 . 读者 不 难 从 表 中 看 轩 一 些 情 沈 ， 
2.* 回归 间 古 的 典 则 形式 简化 六 
此 文 发 表 于 1941 年 .一 般 线 性 回归 模型 
Y=7B Be Y= nn, 
关于 其 回归 系数 成,… ,Bs 的 一 般 线 性 很 设 可 表 为 ， 
再 :es 甩 十 十 rw 有 一 Or 一 1 
& 二 : 户 : 且 问 量 (cotraor 一 过 线 性 无 关 . 这 个 形式 很 复 休 ， 
在 研究 理论 问题 时 很 不 方便 . 许 先 生 下 过 变换 把 它 表 为 如 下 的 典 
虽 形 式 : 
入 一 六 十 e lp; 下 ， 户 十 1 六 (5) 
PY= = ,~—0, C6) 
这 里 ,VY 为 模型 中 的 参数 . 这 个 形式 很 简洁 ,便于 理论 上 的 
研究 . 许 先 生 提 出 的 这 个 形式 成 为 日 后 研究 者 采用 的 标准 形式 ,对 
线性 回归 模型 的 研究 起 了 很 大 的 促进 作用 . 
3.4 芒 浆 畏 数 观 点 下 的 方差 分 析 》. 
发 表 于 1940 年 . 它 首 次 证 明了 方差 分 析 中 的 下 检验 从 功效 
明 数 驱 点 去 看 的 一 种 优越 性 . 
方 磊 耸 析 中 任 一 个 效应 有 无 的 检验 ,部 可 以 蓄 为 上 典 则 形式 (5) 
祈 下 的 假 训 (6). 许 完 生 证 明了 如 下 的 结果 ;如 果 人 假设 (6) 的 水 平 4 


榨 验 不 是 下 检验 ,但 是 其 功效 路 数 在 任 一 个 球面 
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7 二 二 7 二 
上 保持 带 数 , 则 此 检验 的 功效 必 小 于 水 平 ge 的 下 检验 的 功效 . 

这 些 在 当时 都 是 处 于 国际 领先 水 平 的 重要 工作 ,从 理论 上 看 
起 了 开辟 新 的 研究 方向 的 作用 ,也 有 很 强 的 实际 应 用 背景 . 


注 1; 公式 (3) 的 证 明 、 

记 一 了 ,一列 ,一 1 按 皮 尔 提 的 定义 , 关 第 是 (1) 式 的 
六 手写 内 的 表达 式 , 部 xiA'r, 其 中 工 王 ri 中 0): 和 在 是 的 协 
方差 阵 . 有 CN 为 观察 次 数 ) 


AAT 

Vartz = Ny 一 ” ， := ns 

Cov(z,rr) = — ty Lr ns te7. 
于 是 有 

A—A—aw. 
其 中 A 为 对 角 阵 diag 人 ) ,tt 为 行商 量 | 下 于，… ,于 

可 Mt 1 所 Hi a | » ” ” 必 。 

总 J 而 Fe 
按 矩 泗 论 中 的 公式 ,有 
_ A lad! 
:| 

A A TFA 
于 是 

1 【人 过 -TREE A lr) 

下 .下 二 六 如 本 一 《1 十 ii 时 (Al) 
_ 《一 mm 
右边 第 1 项 是 守 一 “又 因 

> Cm) — jt,) 
a 一 站， 
2 

因 

m= N= 2 m, 

了 "二 4 


于 是 得 到 (3) 式 . 证 毕 . 


这 个 计算 比 度 处 进 的 原文 太 天 简 寄 ,是 因为 利用 了 (和 1) 式 . 


庶 尔 避 是 直接 从 人 1)? 式 崖 发 ,要 用 很 党 元 的 方法 计算 行列 式 妨 和 
R 


EF, 


注 2: 费 葡 尔 1924 年 美 于 白 电 度 的 论证 . 
考虑 只 会 一 个 又 数 上 的 情况 .人 设 8 的 真 值 为 刀 ,9, 未 知 , 当地 
参数 值 汐 8 时 ,六 统计 量 之 值 , 记 为 泣 ( 间 ,等 王 


> CE (0 — OY 
DE 
这 里 (二 np,(B0). 锦 葡 条 用 "天 极 小 原则 ”估计 所, 即 取 使 (8) 
达到 最 小 的 8 值 8 作为 名 的 估计 .内 


是 


ZO 
， 四 加 
XC0) = SE,0) 2 >.0 十 车 
此 
1 
有 -= 1 
一 再 2 一 Eo 
点 
> Or 
= 一 村 十 Fay Tv 
列 出 方程 个 =0, 得 
> | ED -0 ; 
;一 1 oi ) ' ‘2) 


让 | 2 已 (9) 一 | 2/ 巨 (2)) 一 1 一 0, 上 式 可 写 为 


4 一 EO ) 
3 一 一 一 一 一 一 一 ECe ) 二 0. (AI) 
| ECO) 


必 导 生 


记 包 二 np,( 久 ), 则 用 泰勒 展开 (在 6 点 附近 ,4 一 名 一 9 .) 


— (0 一 


二- J 
Ei(h) E:c# ) < 
CA4) 
此 村 上 略 去 了 0459,)’ 项 . 
现 有 
~ 1 1 
(0K0 = OO0:|EI eo—|, 
" ” a Et EC 
由 CA4}) 式 ,得 
OX ,| ) 二 一 A 十 丰 , 一 A;， AD 
其 中 
* 2 
= Cg Ag, 
~ E:(0) 
1 a 
,0 )]2046,)?， 
Ei:(f) 


pC AQ). 
2E:(0 ) 


i 二 


' 点 
由 (A2) 式 , 知 4 二 0; 由 于 一 二 1 二 0,(1)， > EC9 )=0 朋 


EC ) 


AA, =n ,1), 庆 | 让 二 unl 1]. 由 性 二 ] 十 0,{1) 知 
EC(H) 


A EG 2A0,):. 
EC(0) 
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表达 式 一 上 (BR )]: 是 Fisher 信息 量 ,近似 地 等 于 
7 Eo) 


、 、 (8. 8 13 
vart5 9, 而 40, 一 6 一 了 . 故 证 近似 地 等 于 | ~ | 
ff WRITE) 
号 | 有 的 量 当 二村 和 C00,1) 人 分 布 为 极限 , 综合 多 上 论证 并 注 
YC0)— YO )——rY¥,*， 


这 样 C8) 比 守 ( 员 ) 少 了 一 个 自由 度 . 当 有 个 参数 时 ,论证 
类 似 . 

拿 现 今 的 标准 来 看 ,上 述 论证 中 的 疝 题 很 多 . 严格 的 证 明 最 初 
出 现在 奈 曼 与 爱 根 ， 皮 尔 了 撑 合作 的 交 章 ¢ 用 于 统计 推断 的 某 些 答 
验 淮 则 的 使 用 和 和 解释 (1928) 的 附录 中 . 差不多 在 辣 时 , 设 帕 德 也 


在 文章 * 将 分 散 的 数据 拟 合 于 一 个 公式 (1929) 中 给 出 了 -- 个 
证 晶 . 


2 4 各 


第 十 章 ”参数 售 计 


参数 信 计 是 数理 统计 学 中 与 假 俊 办 验 并 蜀 的 两 大 基础 分 充 ， 
分 别 研 究 统 计 推 断 两 个 基本 形式 之 一 ,其 理论 和 方法 ,为 数理 统计 
学 中 众多 的 专门 和 应 用 分 区 所 依据 和 使 用 . 

好 果 说 ,假设 检验 这 个 分 支 可 算是 “世纪 和 辣 龄 人 入”, 那 么 ,参数 
信 计 则 是 与 数理 统计 这 门 学科 “有 生 慢 来 ”的 . 收集 数据 的 目的 总 
挟 为 了 怕 讨 蕊 什么 ,可 以 争辩 说 ,这 个 说 法 值得 商检 ,因为 在 漫长 
的 寄 述 统计 时 期 ,计算 之 类 的 量 更 多 是 从 整理 数据 的 眼光 看 ， 
“ 带 参 数 的 一 族 分 布 " 这 种 慨 念 ,还 是 在 20 世纪 20 年 代 才 有 的 . 费 
蚂 尔 在 其 4 理论 统计 学 的 数学 基础 》 一 文中 还 曾 感 吸 对 理论 统计 学 
的 扰 视 ,而 他 措 出 的 两 个 原因 之 一 竟 是 “存在 于 统计 看 和 参数 之 辣 
的 混 清 ". 这 样 看 ;可 以 把 参数 估计 看 成 是 一 个 到 20 世纪 才 有 的 分 
交 . 怎么 看 都 有 道理 ,因为 到 人 计 么 火 剧 才 算得 上 形成 一 个 分 支 , 标 
准 擎 握 可 以 不 间 . 

不 过 如 果 我 们 不 拘 记 于 形式 而 注重 问题 的 实质 , 则 不 能 不 承认 ， 
在 1900 年 之 前 ,数理 统计 学 中 处 理 的 辣 题 , 绝 大 部 分 是 属于 如 今 我 们 
归 入 “参数 信 计 ”名 目下 的 那 一 些 , 目 基本 上 可 归 人 3 大 类 :频率 估计 
概率 ,>z 和 信 计 平均 ,以 及 最 小 二 腾 法 ,后 者 在 19 世纪 时 属于 “数据 结 
合 ” (误差 分 析 ) ,逐渐 且 最 终 完全 归 入 数理 统计 学 的 旗下 . 

从 理论 方面 看 ,也 不 好 把 这 一 段 (1900 前 ) 的 参数 估计 状 沈 全 
看 成 “史前 时 期 ”, 丽 是 已 有 相当 “文明 "的 进展 了 , 伯 努 利 大 数 定 
律 、 犹 蝎 弗 - 拉 普 拉 斯 中 心 极 恨 定 理 等 ,莫不 可 解释 成 且 事 实 上 世 
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是 参数 居 计 理论 的 成 就 ;尽管 “相合 性 " “站 近 正 态 佑 计 ” 这 燃 本 语 
当时 尚 没 有 .至 于 碍 让 德 -高 斯 的 最 小 二 乘 舍 计 和 正 态 误差 理论 ， 
以 及 在 第 4 童 所 述 的 19 世纪 线性 模型 理论 的 进展 ,就 其 方法 应 用 
价值 之 高 及 理论 上 的 深度 , 比 之 20 世纪 的 许多 重大 成 就 都 不 岂 客 
让 ,我们 今天 都 还 被 其 余 泽 . 

自 19 世纪 素 以 来 ,确切 地 说 是 座 1894 年 到 1912 年 , 甩 发 生 
本 两 件 大 事 , 使 参数 估计 在 形成 一 个 近代 意义 下 的 分 支 的 征途 中 ， 
闷 上 了 一 个 台阶 . 一 件 就 是 自 1894 年 起 卡尔 。 皮 尔 人 进 提出 他 的 分 
布 族 , 及 为 确定 族 中 参数 值 而 提出 的 算 知 计 法 . 另 一 件 是 1912 年 
费 回 尔 在 $ 关 于 拟 合 和 冰 率 曲线 的 一 个 绝对 准则 3 一 文中 提出 了 极 大 
似 然 个 计 流 .这 两 任 工作 的 意义 在 于 : 它 不 像 前 此 的 估计 法 只 是 一 
些 可 用 在 特定 场合 的 方法 (如 闫 率 ,z 之 类 ,而 是 有 了 一 个 一 般 框 
桨 , 即 依 顿 子 参 数 的 一 族 分 布 ,所 提出 的 方法 也 有 普 适 性 . 如 估计 
均值 .方差 和 相关 系数 等 问题 ,以 往 都 个 别处 理 , 其 实 都 是 这 两 个 
方法 在 特定 问题 中 的 应 用 . 

所 以 ,到 1910 年 ,参数 人 秸 计 的 局 面 可 比拟 为 一 张 有 4 条 腿 的 
绿 子 ,这 4 订 艇 分别 是 矩 法 、. 极 大 似 然 法 .最 小 二 匀 法 和 贝 时 斯 法 . 
册 时 斯 法 其 实 是 “老字号 ", 但 20 世纪 初 年 几 位 夫 师 ,包括 卡尔 … 
皮 乐 示 和 儿 费 区 和 尔 ( 以 及 后 来 的 这 坚 和 爱 根 。 皮尔 避 ) ,都 对 之 持 批 
判 答 度 , 故 博 癌 有 些 低迷 ,但 其 影响 还 是 可 抑 的 了 . 最 小 二 乘法 在 
它 那个 特定 范围 内 的 使 用 无 人 持 异 议 , 且 其 发 明 者 已 是 圳 人 .和 众 独 
号 法 和 宜 关 亿 然 法 这 两 项 .产品 肌 途 相同 “经营 者 ”都 有 是 大 家 , 难 
更 有 一 个 “一 争 高 下 ”的 问题 . 发 难 者 是 费 欧 尔 , 他 在 其 著作 中 ,所 
嫩 征 法 的 言论 甚 多 .至 于 卡尔 ， 皮尔 议 这 一 方 , 终 其 一 生 未 为 其 论 
天 所 动 . 他 最 后 一 篇 反 驭 的 文章 k 拭 法 和 极 大 似 然 法 》, 发表 于 他 拥 
捞 的 那 一 年 一 一 19356 年 ， 


9 生来 统计 学 家 在 论 及 费 歌 尔 1912 年 的 文章 时 .多 振 这 样 的 观点 ;他 对 做 名 趣 
数 取 极 值 点 的 作 读 ,受到 了 * 恨 时 斯 狠 设 ?的 影响 . 
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本 让 三 兵 宁 其 广 语 


3 10.1 算法 和 极 大 做 然 法 


从 费 歌 尔 1912 年 文章 文 题 中 的 “绝对 准则 ”(absolute eriteri- 
on7 了 四 字 来 看 ,他 对 于 自己 所 提出 的 这 个 估计 方法 的 优越 性 是 有 
“绝对 的 "自信 的 . 文章 一 开始 ,他 就 提 到 现行 的 两 种 将 数据 拟 合 于 
频率 曲线 的 方法 , 即 最 小 二 乘法 种 答 法 .他 对 二 者 都 作 了 批评 . 对 
且 者 的 批评 是 “ 品 然 不 能 用 ”, 因 为 这 与 x 的 尺度 有 关 ; 如 果 用 一 
个 的 ( 严 增 连续 ) 函 数 上 代替 z 作为 横 坐 标 , 拟 合 结果 将 有 改变 . 
同时 ,如 果 数 据 分 组 的 话 ,分 组 方式 的 变化 也 会 影响 估计 的 结果 . 

对 短 法 ,他 说 上 述 反 对 意见 不 适用 .但 是 他 认为 这 方法 * 湾 
有 理论 上 的 合法 性 ”, 对 此 他 没有 仔细 解释 ,接着 他 提出 了 极 大 似 
然 法 并 举 了 几 个 应 用 实例 . 

这 篇 文章 (发 表 在 一 个 各 叫 Nlessenger of Mathematics 的 厅 
齿 上 在 当时 及 以 后 很 长 时 间 设 有 引起 什么 反应 ,很 可 能 皮尔 逊 本 
人 了 世 设 有 注意 它 . 此 事 的 一 个 证 据 是 那 以 后 若干 年 在 皮尔 于 的 著 
作 中 未 见 到 反 双 此 文 的 材料 , 旦 至少 到 1916 年 半 , 皮 尔 偿 与 赐 吕 
水 维持 很 好 的 关系 .到 1922 年 , 费 砍 尔 再 回 到 这 个 题目 ,他 说 除了 
正 恋 分 布 以 外 2 ,和 矩 法 没有 被 证 明 能 获得 (参数 的 ) 最 好 什 . 他 承认 
在 这 些 情况 ( 正 态 以 外 ) 下 , 秆 法 作为 一 个 获得 (和 参数) 近似 慎 的 方 
法 起 可 用 的 ,但 汐 了 在 必要 时 改进 它 , 一 个 更 适当 的 准则 是 必 党 
的 . 这 后 者 当然 是 指 他 的 极 大 似 然 佑 计 . 他 也 指 出 , 像 在 千 诗 柯 西 
分 布 参数 那样 的 情况 , 矩 法 根本 不 能 用 . 

他 上 述 意 见 发 表 于 1922 年 那 篇 大 文章 kt 理论 统计 学 的 数学 基 


一 一 


+ 其实, 这 两 条 部 适用 于 矩 法 , 旦 后 一 条 也 适用 于 极 大 休 起 法 
人 是 指 在 庶 尔 各 分 布 族 中 除 正 态 分 布 以 外 . 
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础 } 中 . 在 此 交 中 全 是 有 其 实质 性 的 意见 , 即 他 证 明 极 大 似 然 犀 计 
的 ( 渐 近 }) 方 甘 为 费 加尔 信息 量 的 倒数 ,而 矩 佑 计 的 方差 则 太 于 它 ， 
因而 不 是 有 效 的 . 他 指出 在 1914 年 以 前 皮尔 了 进 及 其 他 人 造成 了 一 
些 混乱 ,因为 他 也 用 这 辣 一 公式 来 计算 矩 估 计 的 方差 ,而 这 公式 只 
适 册 于 极 友 似 然 什 计 .以 后 ,给 居 计 的 非 有 效 一 直 是 他 批评 这 个 恪 
计 的 基本 论点 . 

费 贺 尔 这 个 论点 是 太 样 本 性 质 的 一 一 而 且 即 使 在 这 个 范围 
内 ,其 数学 论证 志高 严格 性 的 标准 相差 很 远 ,因此 皮尔 逊 不 能 接受 
这 些 论点 ,也 是 琴 以 理解 的 了 . 催 他 却 也 拿 不 出 令 人 人 信服 的 理由 来 
为 矩 法 辩护 .他 对 这 个 方法 的 办 护 集中 伍 现 在 其 1935 年 文章 & 红 
法 和 极 太 似 然 法 》 中 ,在 该 交 所 提出 的 对 这 两 法 进行 比较 的 4 个 条 
件 中 ,有 3 条 是 涉 太 到 数据 和 计算 的 ,只 有 一 条 提出 “对 效率 比较 
必须 有 一 个 大 家 同意 的 标准 , 即 大 冢 都 接受 的 "最 好 的 (估计 ?的 
定义 ”应 该 说 这 一 点 抓 着 了 问题 和 的 实质 . 如 果 要 对 两 个 方法 的 优 
尖 作 全 面 的 比较 , 则 标准 也 要 是 全 而 的 而 非 单 一 的 . 就 算 费 歇 尔 关 
于 算 和 情 计 就 率 不 好 极 太 似 扰 估 计 的 论点 确 有 其 根据 , 那 出 不 能 榴 
途 这 一 点 就 对 二 者 的 优 劣 比较 作出 一 个 判决 . 

诺尔 逊 在 1936 年 去 世 , 这 场 刍 论 { 在 此 二 人 人 之 合 ) 也 就 划 上 一 
个 人 可 瑟 . 但 费 贺 尔 在 1937 年 还 发 表 了 一 篇 文 章 :* 皮 尔 提 教授 与 算 
法 让 他 还 指责 由 于 拒 过 竹 的 注意 力 放 在 "用 和 矩 来 拟 合 曲线 "上 ,及 
啊 了 学 生 们 学 习 其 他 一 些 材 料 , 如 小 样本 .方差 分 析 和 估计 理论 
等 ,这 会 意 来 人 意 被 认为 是 浪费 时 间 . 

从 这 场 争论 的 结局 看 , 费 王 尔 是 胜利 的 一 方 ;这 只 要 失 以 后 
《直到 现在 ) 出 版 的 统计 教 本 中 ,一 般 都 认为 棚 大 似 然 估 计 优 于 和 抢 
秸 计 这 一 点 就 可 以 证 明 ., 这 不 能 说 全 无 根据 ,级 大 似 角 估计 渐 近 方 
老 最 小 是 其 主要 之 点 . 再 说 度 尔 还 之 执著 于 短 法 ,是 因为 事 关 他 的 
整个 体系 ,他 不 认同 Student, 费 旺 尔 谨 大 小 样本 那 一 套 . 前 引 费 
葡 乐 关于 把 过 多 注意 力 放 在 用 抢 来 报 合 曲线 上 ,或 更 一 般 的 理解 ， 
敢 在 皮尔 还 心仪 的 他 那 一 套 老 的 统计 体系 上 的 批评 , 确 并 非 空 从 
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米 风 . 但 作者 觉得 , 单 就 这 两 法 的 比较 上 看 ,而 不 涉及 二 人 整个 的 
钵 系 ,公允 的 结论 应 是 各 有 所 长 ,只 说 一 点 :在 非 参 数 领 域 , 极 大 亿 
然 佑 计 茹 本 不 氨 用 .但 答 法 则 可 是 利 使 用 , 这 椒 仅 在 像 居 计 一 般 分 
布 的 均 信 方差 这 类 问题 ,也 包括 更 复杂 的 诸如 概率 密度 和 非 参 数 
回归 等 疝 题 . 


9 10. 2 充分 统计 量 


充分 性 概念 的 提出 是 费 黎 尔 最 有 独创 性 的 贡 载 之 一 ,其 对 数 
理 和 统计 的 理论 地 有 很 大 的 影响 ,虽然 近来 也 有 一 种 意见 ,认为 因 这 
概念 过 于 恢 和 不 总 体 分 布 的 形式 , 它 对 应 用 统计 的 作用 是 有 限 的 . 

费 上 加尔 提 出 这 个 概念 是 在 1920 年 4 关于 确定 一 个 观察 值 的 精 
度 习 的 两 种 方法 的 数学 考察 :平均 误差 与 去 方 误差》 一 文中 . 此 文 
是 为 了 回答 天 文学 家 爱 丁 顿 在 1914 年 出 版 的 著作 # 行 是 运动 和 宇 
宙 结 神 3 中 提出 的 一 个 看 法 , 即 认为 在 估计 一 系列 观察 值 的 均 方 浊 
差 果 ,用 答 单 的 平均 绝对 残 差 比 用 均 方 残 差 好 . 内 现代 的 确切 术语 
来 讲 : 他 的 意见 是 : 设 zs 是 从 正 海 总 体 wtaya 中 抽出 的 
随机 样本 ,a 和 oa 都 未 知 , 要 估计 go, 通 常用 的 方法 是 ss= 


La Cx, 一)?] “. 爱 工 顿 主张 用 统计 量 


一 人 |， 
m =e. 5 


c 为 适当 选择 的 常数 3 爱 工 宙 还 说 ,这 与 通常 教 本 中 的 主张 相反 ， 
但 可 以 证 明 ,这 是 真确 的 . 
“i 措 其 标 礁 莽 . 


为 本 上 比 改 二 者 的 上 差 ; 示 选 择 世 全 7 为 F 的 无 偏 本 讨 ，s 也 要 洲 上 着 当 的 常数 
d, 合 ds 为 z 的 无 候 估 计 ， 


col 


费 加 尔 先 计算 这 两 个 估计 的 方差 ,发 现 后 者 (m2) 的 标准 差 比 
前 者 大 14 好, 当下 很 大 时 ,他 推论 说 ,由 于 当 二 很 大 时 ,二 者 的 联 
会 分布 渐 近 于 正 访 (这 是 当时 的 习惯 看 法 ,认为 只 要 样 栓 量 大 六， 
分 布 就 会 断 近 于 正 态 , 其 实在 本 例 , 严 格 证 明 并 非 trivial, 放 这 时 
标准 莽 的 大 小 完全 雇 定 其 惰 委 性 .这 证 明 : 和 在 样本 量 闻 很 大 时 ，,: 
居于 2 

但 此 栓 理 对 不 广 时 不 适用 .于 是 费 炊 多 走出 了 其 关键 的 步 
骆 : 他 计算 在 :给 定之 下 mw 的 条 性 分 布 . 这 如 要 得 出 解析 表达 式 
当然 很 难 ;但 费 葡 和 尔 用 nn 维 几 何 的 方法 ;得 出 这 个 条 件 分 布 与 o 匹 
大 (出 与 a 无 闫 ) ,而 给 定 避 时 s 的 条 件 分 布 则 与 a 有关. 以 下 的 推 
理 与 我 们 现在 在 教 本 中 见 到 的 推理 方式 一 样 :这 证 明 在 已 有 了 s 
时 ,上 骨 知 道 zr 已 不 能 提供 关于 5 的 更 多 信息 ,而 反 过 来 则 不 然 , 这 
证 明了 > 对 天 的 优越 性 5 广 工 ). 

费 歌 尔 在 求 文 中 站 未 提出 充分 性 这 个 名 遍 , 首 次 提出 这 个 各 
词 是 在 1922 年 其 章 # 理 论 统 计 学 的 数学 基础 ?中 ,但 其 定 交 所 依据 
的 思想 是 在 本 文中 建立 的 . 费 葡 和 尔 对 充分 统计 量 的 意 尽 是 从 和 更 报 
本 的 用 度 去 看 . 他 认为 统计 方法 的 主要 任务 之 一 是 简化 数据 , 即 把 
数据 中 甩 含 的 有 关 信 息 量 浓缩 在 尽量 少 的 一 些 统计 量 中 ,车 有 充 
分 统计 量 在 , 则 这 一 浓缩 丰 会 造成 侍 何 损失 ,当然 是 最 理想 的 . 

费 风 乐 在 本 文中 也 注意 到 一 个 重要 事实 :他 所 发 现 和 的 关于 条 
件 分布 mis 与 a 无 关 的 性 质 , 与 总 体 的 正 访 性 有 极 太 的 关系 . 他 指 


出 ,在 估计 重 指数 分 布 ( 拉 普 近 斯 分 布 )(2o)-'exp| 一 攻 二 所 | | 的 


列 度 参数 时 :不 如 mt 都 调整 到 无 偏 ). 他 建议 计算 样本 上 峰 度 , 当 它 
接近 3 时 用 .得 则 用 产 . 
拉 普 拉 斯 在 其 1812 年 的 和 名著 忆 概率 的 分 析 理 论 》 中 :也 以 贰 砍 
条 的 方式 很 接近 于 统计 量 的 充分 性 概念 . 他 考虑 的 是 一 元 线性 回 
妆 系 数 的 两 个 估计 的 比较 :最 小 一 洛 居 计 mm, 和 最 小 二 乘 俏 证 mm. 
他 先 求 出 这 二 者 的 级 跟 分 布 ; 比 较 其 渐 近 方 荆 , 证 明 在 误差 为 正 态 
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分 布 时 ,mmz 优 于 wa. 他 进一步 想 在 这 二 者 的 线性 组 合 cm 十 ram 
中 , 找 一 个 渐 近 方差 最 小 者 ,他 于 是 算出 Crsm;s) 的 联合 极限 分 布 
轴 2 维 正 态 , 在 此 基础 上 ,证 阴 了 在 一 切 上 述 钱 人 性 组 台中 ,最 优 者 
就 是 za: 费 欧 尔 比 拉 普 拉 斯 往 前 走 的 关键 一 步 , 是 考虑 了 笃定 其 
中 之 一 时 男 一 个 的 条 件 分 布 . 


3 10.3 费 歇 尔 点 估计 大 样本 理论 


这 主要 包含 两 篇 文章 ,一 是 前 引 的 1922 年 文章 ,一 是 1925 年 
的 & 点 估计 理论 

费 夺 和 尔 的 统计 文章 多 数 属于 这 种 性 质 : 有 一 个 明确 而 具体 的 
主题 . 如 关于 极 大 似 然 估计 的 ,关于 相关 系数 分 布 的 ,关于 下 检验 
和 方才 分 析 的 ,关于 Student 1 分 布 的 应 用 的 ,关于 列 联 表 ……- 的 
右上 日 .这 两 篇 风格 有 点 不 一 样 , 它 的 日 的 是 想 建 立 数 理 统 计 学 的 
-个 总 的 架 梅 .在 他 以 前 ,这 样 的 文章 在 统计 文献 中 还 不 存在 , 因 
此 有 理由 说 ,他 这 些 工作 是 统计 学 走 上 一 个 新 台 价 的 标志 . 

他 在 1922 年 写 的 文章 从 题目 上 看 ,是 要 建立 整个 理论 统计 学 
的 数 尝 基础 ,但 这 篇 59 页 长 的 文章 事实 土 只 涉及 点 估计 ,或 更 确 
切 地 说 ,只 涉及 点 秸 计 中 大 样本 理论 那 一 部 分 . 1922 年 文章 提出 
了 一 系列 的 基本 概念 .论述 中 是 有 售 灶 不 清 之 处 ,数学 上 也 很 粗 
慷 . 1925 年 文章 三 一 定 意 义 上 是 其 深化 , 淤 清 了 前 文中 一 些 不 好 
理解 的 部 分 . 这 两 篇 文章 给 点 估计 大 样本 理论 这 座 大 厦 建 半 了 一 
个 外 元 ,其 "内 部 装 体 ? 蓄 了 好 几 十 年 的 时 间 . 可 以 说 , 它 是 以 后 几 
十 年 此 领域 研究 工作 的 纲领 ,后 大 有 所 完善 .发 挥 和 创造 ,但 基本 
上 居 在 他 规划 的 那个 格局 内 . 

控 费 区 和 尔 的 说 法 ,统计 问题 可 划分 为 以 下 3 个 方 而 :1. 型 式 北 
‘specification ) ， 即 选 定 一 族 分 布 作为 统计 向 题 的 模型 . 2. 属 计 , 骂 
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找 一 个 统计 量 以 估计 模型 中 参数 的 值 . 3. 统计 量 的 抽 梓 分 布 . 与 我 
们 现行 教科 书 的 提 法 比较 ,第 1 条 无 异 , 不 过 我 们 现在 谈 到 总 体 或 
样本 分 布 族 ,也 考 虚 非 参 数 情形 . 第 2 条 我 们 现在 一 般 地 说 统计 推 
断 ,不 限于 合计 ,至 于 第 3 条 ,现在 我 们 太 致 还 这 么 理解 ,但 不 是 在 
严格 的 字面 意 兴 上 ,在 非 正 态 寞 型 中 能 确切 求 出 精确 抽样 分 布 的 
情况 , 汶 数 不 雪 , 可 以 求 出 其 某 种 近 和 山 { 如 大 样本 方法 ) 有 冉 可 通 
这 和 模 扬 ,地 可 能 只 须 考 虑 抽样 分 布 的 基 些 特征 ,如 方差 :. 故 三 相当 
的 程度 上 可 以 说 , 费 黎 尔 为 统计 学 设计 的 这 个 数学 框架 , 喜 到 现在 
我 们 还 泊 用 着 ,当然 在 理解 上 增添 了 不 少 的 新 内 容 . 

在 其 1925 年 交 章 中 有 很 长 一 段 关 于 “无 限 总 体 " 的 论述 ,可 以 
作为 上 述 第 1 条 的 一 个 注脚 “名 体 ”Cpopulation) 这 个 词 在 费 砍 尔 
之 前 ,一直 是 理解 为 一 些 现 实 的 个 体 的 集合 ;如 你 要 研究 某 地 近海 
一 种 是 的 某 一 数量 符 征 , 则 该 地 近海 全 部 这 种 是 就 是 总 体 , 其 数量 
时 可 以 非常 之 多 ,但 总 属 有 限 . 这 有 一 个 很 大 的 不 方便 ,部 这 种 总 
体 的 任何 特征 ,其 分 布 诛 则 上 都 是 离散 的 . 无 限 总 体 这 个 概念 的 引 
人 ,把 两 类 原来 不 同 对 行 的 总 体 统 一 起 来 :一 类 是 实物 总 体 ,; 一 类 
是 像 油 量 一 个 物 忻 之 长 那样 的 试验 值 组 成 的 总 体 , 基 个体 并 非 实 
物 , 是 国 试验 而 产生 ,因而 理论 上 是 无 限 的 . 像 Student + 分布 立 章 
(1908) 是 槟 误差 论 的 基调 写 的 ,因而 一 上 来 就 引进 正 态 分 布 这 个 
无 限 总 体 . 到 皮 水 进 时 期 ,实物 总 体 也 开始 用 正六 等 分 布 作为 近 
侯 , 已 为 费 炊 尔 这 个 无 中 总 体 的 概念 作 了 铺垫 . 怒 今 ,* 无 限 总 体 ” 
这 各 词 已 较 少 使 用 .我们 一 般 直 接 说 “样本 是 从 某 分 布 中 抽出 的 ”. 
但 这 个 培 法 后 而 ,还 是 有 费 加 尔 屠 个 无 限 总 体 的 背景 在 . 

费 葡 尔 在 文章 中 提出 了 下 面 一 些 概念， 

1” 费 区 和 东 相合 性 . 设 某 个 符 个 的 量 了 可 表 为 总 体 分 布 Ps 的 证 
转让 Fe 所 天 这 样本 x 的 经 验 分 布 ,; 则 估计 晤 了 ,一 
8 称 为 有 费 欧 和 尔 相 合 人 性 . 

据 格 利 注 科 定理 , 只 要 泛 函 gg 有 避 连 续 性 . 则 下. 也 是 我 们 更 在 
流行 意义 下 ,.? 的 ( 弱 ) 相 侣 估计 , 费 欧 尔 引进 这 个 定义 的 本 意 可 能 是 

hd 


想 侨 除 这 个 现 得 ;一 个 参数 的 相合 知 计 有 许多 . 但 他 这 个 定 六 并 末 收 
到 这 一 点 . 例如 样本 互 从 正 态 总 体 中 扶 出 ,要 估计 于 ,我们 有 

丽 【 天 各 一 《2 一 1711002、 
定 祥 汪 晒 辣 : 


] 
人 
en- | 泗 生 | ， 


则 g (Fz) 二 of". 于 是 按 定义 ,gz(F.) 一 | rr 是 w 的 对 加 


不 相合 恼 计 ,这 于 #7 二 1,2,*" 都 成 站. 另外 有 意思 的 有 是: 费 软 汞 毕 
生 反 对 乍 居 计 , 但 费时 尔 相合 性 要 求 最 容易 满足 的 ,往往 就 是 柴 
估计 : 

2” 有 效 姓 . 如 一 居 计 为 渐 近 正 态 ,有 昌 其 极限 分 布 方差 达到 最 
小 , 则 称 之 为 有 效 的 . 

3° 充 仓 性 .前 已 提 员 ,费时 尔 基于 充分 性 的 概念 在 1920 年 已 
有 了 ,这 里 他 查 出 了 正式 的 定 文 和 命名 ,证 明了 著名 的 因子 分 解 定 
理 . 他 的 证 明 在 数学 上 杯 够 严格 . 1935 年 奈 曙 纵 了 一 个 更 严格 的 
让 明 ( 放 有 把 这 是 理 称 为 厌 曼 - 贰 坎 尔 定理 的 ). 1949 年 哈 勒 姆 斯 
用 测度 论 工 具 给 了 一 个 完备 的 证 明 . 

费 三 条 有 这 样 的 想法 : 苦 了 .了 , 都 是 #5 的 估计 ,而 工 , 为 充分 
统计 量 , 则 z，, 的 渐 近 方差 oi 不 超过 T, 的 淅 近 方差 有 阐 ,因此 了 ,是 
有 痪 的 . 他 的 证 明 很 别致 ,可 以 罕见 器 加 尔 这 类 推理 风格 之 一 斑 ， 
C7. 22 渐 近 于 2 维 正 态 和 (8,8,5i1,o2.o0). 因此 条 件 期 望 

5, | a = 
ECT, 一 9 十 全 sm 一 9) 一 g 1 一 号 2 tT 
由 于 了, 为 参数 的 充分 统计 量 , 玉 (了 ,| 了 TD) 应 与 无关 .故人 有 1 
-一 0, 内 而 of=prof 由 于 1p| 近 1, 知 可 所 中 . 
证 毕 ， 
证 明 错 误 之 处 当然 在 于 ,.(717) 的 分 布 只 是 接近 而 非 等 于 
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N98.07 ,Pp) ,而 当 分布 差 之 毫 厘 时 ,条 忻 期 望 可 以 失 之 寺 里 +. 


4* 极 大 似 然 估计 8 为 浙 近 正 态 ,和 渐 近 方差 为 费 葡 尔 信息 量 
的 倒数 . 

在 这 个 阶段 , 费 砍 尔 还 相信: 极 大 似 然 估 计 为 充分 统计 量 ,他 
其 至 试图 给 一 个 “证 明 ”, 然 而 到 1925 年 时 ,他 已 明白 这 个 论断 不 
成 立 , 因 此 ,即使 用 极 大 似 然 估 计 , 样 本 中 的 信息 也 还 有 所 损失 ,在 
1925 年 文章 中 他 花 了 不 少 篇 幅 讨 论 这 个 问题 ,但 在 其 后 半 个 世 
纪 , 未 得 到 多 少 响应 ,到 1970 年 代 , 有 的 学 者 从 几何 的 角度 重新 审 
视 这 个 问题 ,提出 了 若干 新 见解 . 

要 是 极 大 似 然 和 估计 是 充分 统计 量 生 人 性质 3" 成 立 , 则 费 软 尔 的 
理论 可 以 画 上 一 个 圆满 的 句号 . 因为 车 如 此 , 则 据 3* 知 极 大 似 热 
估计 为 有 效 佑 计 , 因 而 性 质 4* 给 出 了 估计 的 渐 近 方差 的 - -个 可 达 
到 的 下 界 . 因 这 二 者 都 不 真 , 故 一 切 无 从 谈 起 ,这 倒 给 后 人 留 下 了 
不 少 研究 的 空间 . 有 意思 的 是 ,最 终 的 结论 基本 上 肯定 了 费 睦 尔 当 
初 的 料想 , 即 极 大 似 然 估计 是 渐 近 方差 最 小 的 估计 一 一 虽然 有 埃 
并 斯 指出 的 对 基 些 参数 值 超 有 效 性 的 存在 ,但 如 勒 康 1953 年 证 其 
的 ,这 种 参数 值 的 集合 至 多 只 能 占据 一 个 勒 贝 格 零 测 集 . 可 以 说 ， 
以 后 几 十 年 关于 点 估计 大 样本 理论 的 工作 ,主要 集中 在 极 大 似 热 
估计 的 研究 上 .有 的 学 者 也 提出 了 其 他 形式 的 渐 近 性 质 的 问题 . 可 
异 的 是 ,这 些 研究 成 果 中 所 加 的 正则 性 条 件 多 而 繁 ,缺乏 数学 美 ， 
在 实用 的 层面 上 也 未 能 添加 多 少 东 西 , 故 不 在 此 多 着 笔 野 了， 
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中 筑 歌 乐 这 个 结果 一 般 也 不 成 立 , 除 非 悄 计量 Ti 也 是 完全 统计 量 .这 时 充分 统计 重 
只 上 有 惟 -- 的 一 个 . 
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§ 10.4 小 样本 


指 的 是 在 样本 量 固 定之 下 ,寻求 符合 某 种 优良 性 标准 的 估计 
的 方法 和 理论. 在 瓦尔 德 统 计 决 策 理论 的 著作 在 1950 年 问世 之 
前 ,这 上 方面 惟一 的 有 些 成 果 的 问题 ,是 研究 在 无 偏 性 的 限制 下 ,和 寻 
找 方 闭 一 臻 最 小 的 估计 ,简称 UMYVYU 估计 . 

无 侦 性 作为 一 个 谁 则 的 实际 运用 由 来 已 久 . 样 本 均值 和 频率 
是 在 早期 使 用 的 两 个 主要 售 计 ,它们 都 有 无 偏 性 . 作为 一 个 准则 正 
式 提 出 来 ,最 早出 自 高 斯 1821 年 的 {数据 结合 理论 的 著作 ,; 它 是 
作为 * 巨 系统 误差 ”的 一 种 表述 并 与 其 最 小 二 莱 法 的 研究 相关 联 ， 
全 于 以 方差 作 为 无 偏 估计 优 和 请 性 的 指标 也 是 出 和 此 高 斯 ,其 误 善 正 


态 分 布 的 形式 。* exp| 一 于] 中, 反映 精度 且 完 全 决定 了 这 个 分 


布 , 而 它 是 误 养 方 盖 的 2 倍 ， 

到 1950 年 ,文献 中 已 出 现 一 些 具 体 的 UMYVYU 的 例子 ,涉及 
好 玫 种 方法 ,如 克拉 芋 - 劳 CC. R. ) 不 等 式 , 与 零 的 泡 偏 估计 不 相关 
以 及 着 为 无 偏 估 计 的 函数 等 . 1950 年 ,美国 统计 学 家 芋 蝇 (EE. LL. 
Lenrnanny 和 时 菲 4H.Scheffe7 发 表 文 章 #4 完 全 性 .相似 区 域 与 无 伪 
住 计 》, 其 中 引进 了 统计 和 电 的 完全 性 这 个 概念 ,证 明了 : 苦 工 是 一 
个 完全 而 充分 的 统计 量 , 且 大 (了 ) 是 gg 的 无 偏 估计 , 则 扬 ( 开 7 就 
是 g(9) 的 MYUE. 以 后 这 方面 也 再 没有 什么 实质 性 的 进展 . 本 
来 ,MVYUE 存在 的 场合 是 例外 而 非常 见 ,这 些 例 外 包含 了 一 些 常 
网 的 (涉及 指数 分 布 族 和 截断 分 布 族 } 估 计 间 题 ,它们 都 可 用 药 虹 - 
砍 非 的 定理 解决 . 

瓦尔 德 的 统计 识 策 理论 从 两 个 方面 拓展 了 点 千 计 小 样本 优良 
性 的 研究 范围 . 一 是 损失 尔 数 由 平方 推 向 一 般 , 二 是 优良 性 标准 的 
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多 样 什 . 如 要 小 化 要 大 (minimax)? 淮 刚 是 从 一 个 媒人 台 指 标 去 考察 
估计 量 的 优良 性 ,而 同 变 (Cinvariant) 最 优 淮 则 与 MVUE 相似 ,是 
在 对 所 考虑 的 佑 计量 的 灶 加 以 限制 的 前 扣 下 ,从 这 个 绽 小 了 的 类 
中 寻找 一 臻 最 优 者 ,在 五 六 十 年 伐 ,这 个 方向 的 研究 曾 是 总 售 计 和 研 
究 的 主流 . 在 正 态 分 布 . 指 数 族 分 布 及 忆 置 -刻度 参数 分 布 等 的 苍 
半 内 有 和 若 千 具体 成 果 . 这 类 工作 ,技术 性 的 成 分 大 且 涉 及 的 人 很 
多 ,不 在 此 一 一 论 列 了 . 

点 司 计 小 样本 研究 的 另 一 个 热 帮 题目 是 估计 的 容许 性 . 问题 
是 要 在 -- 定 的 模型 下 (总 体 分 布 .损失 了 旺 数 ) ,决定 哪些 估计 是 可 容 
证 或 不 可 容许 .在 1950 年 代 有 上 用 CC 六 不 等 卫 法 在 指数 分 布 族 
范 田 内 取得 一 些 成 果 , 其 他 还 有 痊 于 散 见 的 成 果 , 这 种 问题 的 数学 
难度 很 太 ,在 一 个 具体 问题 上 取得 一 点 进展 己 属 不 易 , 更 亿 论 系统 
的 进展 了 . 实质 上 ,这 类 问题 的 数学 意义 重 于 其 统计 意义 . 其 定位 
应 该 是 有 统计 背景 的 数学 问题 . 

有 一 项 关于 容许 性 的 工作 引起 统计 界 的 广泛 兴趣 . 美国 统计 
学 家 斯 坦 因 (CC. Stein)1956 年 在 第 3 次 人 死 和 概率 统计 讨论 会 上 
发 表 了 一 篇 题 为 4《 客 维 正 态 分 布 均值 常用 估计 的 不 容许 性 》, 其 中 
包含 了 一 个 出 人 意料 的 结果 : 设 苑 1, ,区 ,是 抽身 正 态 分 布 N 


C1) 的 样本 ,要 估计 97 二 3140; 记 ;全体 样本 独立. 记 站， D1 4, 
常用 于 和 估计 a, 的 是 入 斯 坦 因 考 虚 平 方 损失 
Lidsa) = Dd, — dy), 


证 明了 : 府 p23, MR, .作为 ae 的 估计 ,是 不 可 窖 
汗 的 . 他 并 具体 指出 :夺取 


则 有 
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应 * 
DEIT, al < DEIR,— al: = 


这 个 结果 的 实际 舍 义 是 :本 来 估计 ai,…*sas 是 pp 个 不 相干 的 问 
是 . 照常 理 , 佑 计 ai 只 应 用 到 与 之 有 关 的 样本 za' 而 在 这 
个 疡 合 下 ” 已 知 是 一 个 和 良好 的 估计. 现在 斯 坦 因 的 结果 告诉 我 们 
说 ,情况 并 非 如 此 ,在 估计 a 时 ,除了 使 用 二 1 外 ,还 要 使 用 
另外 p 一 I 组 己 之 木 相 二 的 样本 ,才能 得 到 更 好 的 结 乐 .这 个 说 法 
与 常理 相 赴 背 . 

这 个 结果 的 深刻 会 义 在 于 : 它 显示 了 数 党 理论 与 实用 考虑 之 
间 的 一 种 不 合拍 ,因而 使 人 对 这 种 理论 的 有 效 性 提出 了 疑问 . 毕竟 
统计 学 是 一 门 实用 学 科 , 一 个 问题 ,从 模型 手法 .优良 性 准则 到 数 
学 论证 :不 论 看 上 去 多 么 合理 ,最 后 还 得 落实 到 应 用 上 的 合理 性 这 
一 条 . 对 斯 坦 因 这 个 结果 从 实用 层面 来 看 ,不 会 动摇 人 们 对 习 凡 为 
常 的 合计 (和 思 的 信赖 ,而 是 反 寺 来 ,对 平方 误 善 损失 ,对 用 
风险 孙 数 衡量 一 个 售 计 的 优良 性 这 些 基本 出 发 点 的 合理 性 提出 
质疑 . 


$10.5 区 闻 估 计 


把 对 参数 的 估计 表 成 区 间 的 形式 ,最 早 见 于 拉 普 拉 斯 1812 年 
的 著作 * 概 们 的 分 析 理 论 》, 是 关于 用 频率 和 鸽 计 概率 的 疝 题 . 这 种 形 
式 出 藤 见 于 19 世纪 包括 高 斯 在 内 的 一 些 学 者 的 著作 中 ,到 20 世 
纪 ,类 国 统 计 学 震 郝 泰 林 首 先 物 出 了 严格 的 置信 区 间 的 便 子 . 

到 1930 年 初 ,已 有 了 两 种 构造 区 间 情 计 的 方法 ,一 种 是 由 时 斯 
法 ,此 法 有 园 定 的 程式 :每 有 了 样本 xz 后 ,根据 样本 分 布 和 先 验 分 
布 ,算出 参数 8 的 后 验 分 布 p(8|x). 于 是 对 给 定 的 <10<<a<<1) ,和 找 


a .5b( 都 与 x 有关) ,使 | 2 19|x)d9 二 1 一 a, 用 上 ,的 作为 的 区 疗 


要 


舍 计 , 蒜 “ 后 验 置 信和 度 ” 为 1 一 a. 此 法 的 最 天 好 处 是 原则 王 易 行 , 椒 丰 
在 求 提 样 分 布 的 数学 难题 . 阿 题 在 于 先 验 分 布 的 取 法 没有 征 淮 , 当 
时 统 讨 界 包 括 费 软 尔 在 内 的 一 批 领 世人 物 对 此 密 有 批评 . 

胃 一 个 方法 是 费 点 未 的 信任 分 布 法 ,这 我 们 下 面 再 谈 . 如 今 单 
说 公 受 ,他 的 想法 是 把 待 估计 的 参数 和 视 为 一 个 测定 的 未 知 量 ,只 
依靠 现行 的 概率 论 ,来 梅 建 一 套 区 间 估 计 的 理论 .在 奈 受 那里 ,区 
证 知 讨 14(Ccry 呈 人 rI 是 一 个 依赖 于 祥 本 x 的 随机 区 间 ( 这 一 点 与 
由 叶 斯 法 种 竟 点 尔 的 信任 分 布 法 无 别 }. 其 置信 和 度 , 也 称 置 信和 系数 ， 
则 是 这 个 区 间 能 包 会 8 的 概率 Pd4fzrIses Er .这 就 与 另外 
两 个 方法 不 同 : 对 男 两 个 方法 ,置信 上 讶 是 理解 为 当 作 随机 变量 看 的 
8 落 在 区 加 CACx) ,Btz)] 内 的 概率 ,而 样本 x 看 成 固定 的 . 

亲 曼 这 个 想法 最 初 应 用 于 他 1934 年 一 项 甘于 抽样 调查 的 论 
文 & 论 代表 性 抽样 的 两 个 不 同方 面 ? 中 . 以 后 的 几 年 他 致力 于 研究 
这 方法 的 理论 基础 , 即 与 这 种 人知 计 有 关 的 优 和 良性 准则 的 问题 . 文章 
发 表 于 1937 年 , 题 为 4 基于 经 典 概率 论 的 统计 和 合计 理论 络 皮 》, 载 
于 《时 家 学 会 哲学 会 报 》 这 就 是 我 们 现在 从 教科 书 上 看 到 的 泰 晕 
团 信 区 间 理 论 的 主要 内 容 , 其 中 心思 想 是 在 填 信 区 间 与 假设 检验 
之 问 建 立 一 种 联系 ,从 而 可 以 把 有 闫 假设 检验 的 优良 性 的 结果 转 
化 为 有 天 区 闻 依 计 的 优良 性 的 结果. 

在 寻 坚 的 传记 # 农 曼 一 一 现代 统计 学 家 》 中 , 较 仓 细 地 拱 述 了 
此 广发 表 的 陆 折 经 历 , 颇 有 助 于 我 们 了 解 当 时 英国 统计 学 界 的 一 
些 情况 ,再 摘要 介绍 于 下 . 

东 驾 在 1936 年 9 月 将 写成 的 文章 投 寄 给 (生物 计量 }》 染 志 . 当 
时 过 根 ， 皮 尔 扣 已 接替 他 刚 去 世 不 丸 的 父亲 担任 该 刊 的 主编 . 爱 
根 加 全 说 他 认为 达 曼 的 论 立 “许多 部 分 异乎 守 常 的 好 ”, 但 对 于 在 
同 刊 上 发 表 此 文 则 有 保留 . 一 个 次 要 之 点 是 文章 太 长 (后 来 在 皇 
家 学 会 哲学 会 报 》 上 发 表 时 占 了 近 50 页 的 篇 幅 ), 主要 之 点 是 爱 根 
认为 该 女 太 理论 化 , 太 数 学 化 ,不 曙 为 实用 统计 学 家 所 接受 . 几经 
民 复 后 , 爱 根 。 皮尔 坟 决 定 不 采用 这 篇 文章 . 据 泰 受 自 己 说 ,这 是 
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这 两 位 曾经 是 亲密 的 合作 者 之 馈 分 上 幢 的 开始 . 

关爱 根 与 奈 汉 当时 的 关系 看 , 爱 根 这 个 行动 当 不 是 出 于 宗 洪 
情 畦 的 作 崇 .而 是 友 上 遇 了 当时 丑 国 统计 界 的 主流 思想 ; 即 统 计 论 六 
主要 应 当世 含 能 用 于 实际 问题 ,能 被 实用 工作 者 理解 的 方法 ;而 不 
能 包含 过 多 的 纯 理 论 和 和 数学 的 内 容 .但 是 ,这 也 反映 了 爱 报 在 当时 
对 杂 尝 的 工作 的 意义 误 之 足够 的 居 价 ,以 及 当时 统计 界 相当 多 的 
人 人 那 种 轻视 理论 研究 的 偏 狭 观 点 . 

论文 被 退 稿 一 定 使 这 上 蝇 很 伤心 ;因为 他 对 此 文 倾注 了 许 包 心 
页, 他 其 全 把 此 六 的 份量 放 在 他 与 爱 概 合作 的 假设 检验 论文 之 上 . 
他 要 设法 寻找 出 路 .但 当时 英国 的 统计 刊物 被 两 大 巨头 所 控制 ; 爱 
恨 控 制 了 4 生物 计量 》, 而 惧 葡 尔 有 力量 决定 一 篇 文章 能 否 在 此 外 
的 任何 一 军 重 要 的 刊物 上 上 发表. 最 后 他 决定 到 英国 最 权威 的 科学 
洒 志 一 一 皇家 党 会 哲学 会 报 》 去 试 一 试 . 

他 想 找 当时 英国 的 权威 统计 党 家 约 尔 推荐 (此 人 我 们 在 第 七 
草 介 绍 这 ). 约 尔 表示 为 难 , 因 为 他 是 偏 实用 的 .不 能 理解 栾 曼 的 工 
作 . 最 后 他 找到 当时 英国 贝 叶 斯 学 派 的 领袖 杰 弗 里 斯 . 后 者 二 对 由 
叶 斯 学 深 的 看 法 不 同 与 费 葡 尔 有 也 秆 ,因而 可 能 管 应 推荐 (当时 奈 
曼 与 费 歌 尔 之 间 关 系 已 很 紧张 ), 他 这 个 估计 没 错 . 

推荐 后 还 须 2 人 审 稿 . 审 稿 人 之 一 约 尔 作 了 否定 的 评语 , 老 而 
丸 一 位 审 稿 人 人 . 也 是 当时 英国 统计 界 的 权威 人 物 的 艾 特 肯 教 授 , 作 
了 人 育 定 的 评价 , 且 他 的 理由 比 约 尔 的 理由 更 有 力 , 此 文才 得 以 通过 
审查 . 

东 坚 这 篇 论文 给 他 在 燃 国 这 一 段 的 工作 ,也 可 以 说 是 冶 他 长 

达 五 十 余年 的 统计 生涯 中 最 富 创 造 性 的 时 期 , 划 上 了 一 个 句号 . 次 
年 他 即 离开 英国 去 伯克利 吉州 大 学 工作 ,在 那里 开 且 了 一 番 新 天 
地 ,他 起 美工 作 这 件 事 标志 着 一 个 新 时 斯 的 开始 , 即 英国 学 派 影响 
走 问 八 落 和 世界 统计 学 中 心 逐 渐 移 向 美国 . 这 一 点 固然 有 统计 堂 
发 展 上 自身 的 因素 ,也 与 战 时 及 战 后 英美 两 国 国力 的 消长 不 无 关系 . 

下 历来 谈 谈 费 歌 尔 的 信任 分 布 . 
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“信任 分 布 " 这 个 名 词 最 初出 现在 费 歌 尔 于 1930 年 发 表 的 文 
草 & 逆 概率 + 中 . 以 后 在 1934 年 到 1939 年 期 和 间 亿 还 发 表 了 好 几 篇 
关于 这 个 题目 的 文章 . 

绍 王 未 的 想法 是 ;由 样本 定 出 参数 日 的 一 个 概率 分 布 , 他 称 之 
次 信任 分 布 . 这 与 由 时 斯 学派 的 目标 相同 ,但 达到 这 个 且 标 的 扯 笑 
杠 民 .在 只 叶 斯 詹 , 为 作 岂 后 验 分 布 . 除 需 要 利用 样 李 分 布 和 ,还 要 
利用 一 个 外 加 成 分 即 和 完 验 分 布 , 费 软 尔 的 信和 全 分 布 则 上 只 利 用 前 者 . 
一 号 有 了 信任 分 布 , 即 可 将 其 用 于 对 有 的 统计 推断 , 庶 用 的 方式 与 
风 计 斯 学 烘 使 用 后 验 分 布 的 方式 相同 . 

他 的 概念 可 以 用 一 个 简单 例子 说 明 . 设 样 本 工 抽身 正 态 首 体 
NO.1) ,可 以 把 二 表 为 

了 一 站 十 人 17。 

把 e 移 问 左边 ,得 8 二 xz 一 e. 这 一 切 运算 都 设 有 可 掩 昌 的 地 方 .但 费 
允 尔 对 此 式 给 了 一 个 全 新 的 解释 ;他 把 x 看 作 固 定 移 已 知 数 而 e 
则 仍 保 持 它 原来 的 身份 . 这 一 来 ,8 作为 一 常数 与 一 随机 变量 之 
磊 . 可 视 为 一 个 随机 变量 ,其 分 布 为 NC(r,1). 费 砍 尔 把 这 称 汶 用 
的 信和 性 分 布 . 

这 个 称呼 的 直观 背 桩 是 : 设 我 们 知道 总 体 有 分 布 N18,1). 在 
摘 样 前 ,对 8 茫 无 所 知 , 抽 样 得 到 xz 后 ,由 为 靠近 并 的 8 值 能 产生 
样本 工 的 可 能 性 大 ,我 们 对 它 信 任 多 一 些 , 而 对 远离 x 值 的 8, 信 
任 程度 小 一 些 . N(z,1) 这 个 分 布 从 数量 上 确切 地 刻 划 了 我 们 对 各 
种 不 间 的 8 从 的 信任 程度 的 大 小 . 

站 在 传统 的 立场 上 看 ,这 种 推理 当然 不 能 成 立 . 因为 首先 的 一 
条 ,8 经 然 是 一 个 固定 的 数 , 何 来 分 布 ? 但 我 们 可 以 不 管 这 些 , 而 把 
它 作 为 一 个 公理 接受 下 来 .但 为 使 这 成 为 一 个 有 用 的 统计 推断 方 
法 ,有 两 个 问题 必须 回答 ， 

1. 它 有 否 直 观 背 景 , 其 推论 是 否 与 人 人 们 的 经 验 大 致 符合 ? 

2. 它 在 理论 上 能 吞 自圆其说 ,不 产生 歧义 和 和 内 在 矛盾 ? 它 的 
方法 是 否 有 足够 广 的 使 用 范 国 ? 
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费 砍 尔 没 有 给 信任 分 布下 一 个 一 般 的 、 可 操作 的 定 浆 ,对 天 十 
常见 的 单 参数 情况 ,使 用 枢 输 变量 和 充分 统计 量 ,可 给 出 参 逆 的 信 
任 分 布 .例如 ,总 体 分 布 为 Nt,13 ,样本 Tv:To 这 财 ,= 一 


一 0) 一 入 (0,，1), 故 9 一 一 一 给 出 9 的 信和 任 分 布 


Nj, 二 | .车 用 样本 中 位 数 吉 , 则 ww 一 VR Cm 一 候 的 分 布 也 与 6 
无 关 , 因 此 由 9 二 册 一 二 也 可 以 给 出 9 的 信任 分 布 . 费 软 尔 的 意 
天 


见 是 前 者 正确 而 后 者 不 对 ;因为 前 者 是 基于 充分 统计 量 . 但 是 ,在 
充分 统计 量 不 存在 的 场合 ;问题 就 麻 糯 了 .例如 ,者 zi,…… ,x 是 从 
柯 西 分 布 中 抽出 的 样本 ,参数 8 的 信任 分 布 该 如 何 定 ? 

在 多 参数 情况 ,问题 更 形 复杂 ,少数 存在 充分 统计 寿 的 情况 ,可 
仿照 一 维 用 杠 轴 变量 的 方法 去 处 理 . 例如 设 zz 是 从 Nao ) 


中 抽出 的 随机 样本 . 记 工 - >) 于 ,5 一 | > 这 二 | . 令 


一 名 
此 一 nt， Tr! 一 ww 一 


何 


其 NO,1} te ~ 1 Te 各 立 . 战 Cz ,tw) 的 联合 分 布 可 以 求 
出 . 利用 
日 一 六- 一 = Va， 可 一 mr， 
将 r+ 和: 视 作 常数 ,上 式 可 年 出 (9,o) 的 (信任 ) 分 布 . 
在 上 述 这 类 科 单 例子 中 ,由 费 软 尔 信 任 分布 得 出 的 结果 ,与 通 
带 频 率 学 派 方法 得 出 的 一 致 . 如 由 上 式 得 


vA Y 一 及 了 


-一 人 全 一]- 


中 Te 


1 
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因此 得 出 品 的 "信人 性 "区 间 居 计 就 是 一 样 林 区 间 个 计 , 与 用 奈 竖 
的 置 悟 区 冒 方法 一 样 . 所 这 最 宁 人 们 曾 觉 得 , 费 区 和 尔 信 任 分 布 砂 过 
是 原 有 方法 的 一 个 不 同 的 说 法 而 已 ,但 后 来 发 吏 事 情 没 有 这 必 
简单 . 

问题 涉及 在 方差 不 同日 未 知 时 ,; 作 商 个 正 态 分 布 均值 差 的 区 
问 信 计 间 题 . 统计 学 上 把 这 个 国 题 吓 航 贝 伦 斯 - 费 葡 和 尔 问 题 . 页 伦 
斯 在 1929 年 一 篇 误 章 中 研究 了 这 个 问题 ,而 费 殉 尔 在 # 统 计 推 断 
中 的 信任 法 3》(1935) 与 《关于 从 方差 可 能 不 等 的 总 体 中 抽出 的 样本 
的 比较 认 1939) 等 论文 中 ,用 他 的 信任 分 布 概念 讨论 了 这 个 问题 . 
费 砍 尔 的 推理 很 简单 :有 
a) Vn (ya,) 

a 
这 里 iyn 分 别 是 具 wa 和 gesya 中 捕 出 的 样 束 个 数 ， 
ss 分 别 是 其 样本 标准 差 . 由 下 式 得 

oa 一 如 一 YY I 十 Wi， WE 
因 7，y5vsz 都 袖 为 常数 ,和 且 W 的 分 布 与 参数 无 甘 ( 求 W 的 分 布 
用 到 ses 独立 这 一 点 ]: 故 ea 一 ai 的 信任 分 布 训 议 求 出 ,利用 广 
个 分 布 可 定 出 as 一 a, 的 信 侍 区 亲 . 

此 问题 的 解 在 信任 分 布 的 历史 中 有 相当 的 意 祥 . 它 对 一 个 用 
频率 派 方法 难 予 处 理 的 重要 问题 ,给 了 一 种 明确 的 解法 而 不 必 涉 
上 臣 大 样本 ,这 说 明 它 并 非 原 有 方法 的 改头换面 的 形式 ,而 是 能 提供 
一 些 斌 杂 西 .可 以 说 ,要 不 是 这 个 例子 , 费 软 尔 的 信任 分 布 法 可 能 
后 就 第 人 遗忘 了 . 

坚持 频率 派 观 点 的 这 曼 对 费 歌 和 尔 的 解法 不 以 为 然 , 他 在 1941 
年 发 表 的 文章 《信任 论据 与 置信 区 间 理 论 》 一 文中 , 除 作 了 原则 性 
的 批评 外 ,还 就 若干 特例 作 了 计算 ,证 明 费 歇 汞 所定 的 信任 系数 与 
用 他 的 置信 区 况 理 论 算出 者 不 符 , 如 对 六 一 12.m 一 6 友信 任 系 数 
9. 95 ,用 和 费 葡 和 泵 方法 得 出 的 信任 区 间 , 按 奈 营 置信 系数 定 尽 不 为 
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S， 


0. 95 : 它 与 方差 比 Pp 二 二 有关 , 当 Pp 一 习 .1;1 和 19 时 ,置信 系数 分 


别 沪 0. 966.0. 960 和 0. 934. 不 过 这 个 差异 还 不 巩 坟 ,和 倒 使 人 觉得 
费 误 尔 的 解 还 是 可 入 的 . 

但 是 , 费 区 和 尔 的 信任 分 布 法 终究 未 能 形成 气候 ,因为 未 能 给 出 
一 个 确定 信任 分 布 的 一 般 方 法 .在 费 答 和 丰 对 数理 统计 学 的 请 狗 真 
献 中 ,这 是 引起 争议 的 最 大 的 一 项 . 几 十 年 来 ,也 不 断 有 些 学 者 在 
这 个 方向 全 进行 探索 ,但 看 来 都 未 取得 什么 真正 有 意义 的 进展 . 比 
较 值 得 注意 的 是 弗 药 完 所 提出 的 所 谓 " 结 构 概 率 " 或 “结构 推断 ”， 
弗 菜 于 是 加 拿 太 多 伦 包 天 学 教授 , 自 1960 年 代 初 以 来 ,他 和 他 带 
领 的 学 生 在 这 个 方向 上 写 了 一 系列 的 文章 ,总 和 的 目的 是 为 信任 分 
布 给 出 一 个 适用 范围 较 广 的 确定 方法 . 

他 的 方法 最 好 通过 焕 子 来 说 明 . 先 考 虑 一 个 只 会 一 个 位 置 大 
数 的 例 . 证 rr 是 从 具 密 度 fz 一 各 中 抽出 的 随机 样本 , 葬 
数 rr 已 知 , 可 以 将 这 模型 写 为 

| 一 有 -er 一 用 十 e (1) 
ee 省 让 同 分 布 , 其 公共 分 布 已 知 旦 具 密 度 f(x). 旨 荣 赛 把 
它们 称 为 "误差 变量 ”. 弗 莱 塞 的 结构 概率 包含 3 个 成 分 ;数据 , 误 
其 变 蜂 及 一 个 把 这 二 者 联系 起 来 的 变换 ( 群 ) ,在 此 例 中 即 {1). 记 
二 一 《es 一 ze 一 人 ye el). 

这 是 此 变换 群 的 航 大 不 变量 ,考虑 条 件 分 布 e 1#, 其 密度 为 
TY He ed (te — ee) 


h (ez re] 3 一 下 


和 (| 二) 一 


本 


其 中 
用 (ea — err ye, 一 上 |》 
一 | FOF es — Ee) ft te, — eydt. 


有 了 1 的 5 某 件 ?分 布 ,再 利用 8 二 一 el1; 肛 得 a 的 (条 伴 , 信 性 } 分 
布 , 其 密度 为 
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Fr Ot 


h(ir, 一 一 一 as】 
PAC “frp) —8) 
一 — Ty 


这 个 作法 的 实质 可 以 解释 如 下 :对 w=1 的 情况 ,只 有 z=9 二 ei 一 
个 式 子 ,由 9 一 zx, 一 e 自然 得 出 8 的 信任 分 布 . 若 # 之 1, 则 每 个 式 
了 于 广 二 8 十 e, 者 可 得 出 8 的 一 个 信任 分 布 ,它们 不 一 致 , 击 且 单 用 
一 个 式 子 就 没有 利用 其 他 样本 的 信息 ,所 以 要 想 一 种 办 法 结合 起 
来 使 用 . 如 果 7 为 正 态 密度 , 则 了 为 充分 统计 量 , 故 一 个 看 来 合理 
的 办 法 是 用 一 9-+5,5 一 了) 各 一 N | 9, 二 | 分 布 已 知 ,在 没有 充 
分 统计 量 时 就 得 另 想 办 法 . 这 里 用 的 办 法 是 取 条 件 分 布 

再 看 一 个 稍 复杂 一 些 的 例子 -一 -位 置 -刻度 参数 族 . 设 x ，…， 


z, 是 抽 自 密度 用 工 -全 


别 为 位 置 布 对 度 参 数 . 令 

=e 一直 re (2) 
eine, 为 旨 莱 窜 的 “误差 变量 ”, 它 们 独立 同 分 布 基 公共 分 布 密 
度 为 已 若 的 ;变换 群 (2) 的 极 大 不 变量 为 


0 一 | 


| 的 随机 样本 ,一 ><8<co 和 o>0 分 


| _ 刁 | 
[es—el| ea。 一 el | ， |， 


为 n 一 2 维 . 我 条 件 密度 fey ,1es)17, 记 为 碳 尼 ,ts,), 利用 


(rz 一 工 1 月 一 Te 
(es—el} i! [Ke 一 后] ) 


塘 通 间 求 随机 蛮 量 函数 密度 的 公式 ,并 注意 到 ?只 与 样本 有 关 ( 国 


一 1 一, 得 到 (8, 四 的 (条 件 ,信任 ) 分 布 的 密度 函数 . 
从 这 两 个 例子 不 难 罕见 弗 莱 塞 的 方法 在 一 般 变换 群 下 的 标 作 
方式 . 也 不 难 见 到 ,他 这 个 方法 适用 范围 有 限 , 基 本 上 限于 线性 变 


痪 群 下 有 不 变性 的 这 种 分 布 族 , 且 表 达 式 异常 繁复 ,这 都 对 这 一 方 
<bb 


上 一 一 


电 


法 的 有 用 性 投下 了 疑问 . 

上 让 如 美国 统计 学 家 埃 才 龙 (B. Efron)1978 年 发 表 在 ¢ 美 国 数 
学 月 刊 * 上 的 一 篇 题 为 统计 学 基础 中 的 争论 ?的 文人 草 中 所 指骨 的 ; 
“ 绝 太 名 数 , 即 使 不 说 全 部 的 当代 统计 学 家 ,或 者 把 它 ‘ 信 和 任 推 断 ) 
看 成 尾 客 观 由 叶 斯 主 久 的 一 种 形式 ,或 者 干脆 就 是 一 个 错误 .” 当 
然 ;在 某 种 有 限 的 范围 内 这 个 方法 有 其 用 武之 地 ,由 人 和 伦 斯 - 费 砍 泵 
问题 就 是 一 个 俩 于 .但 是 , 念 把 这 个 方法 发 展 成 为 一 个 能 与 频率 学 
派 和 和风 叶 斯 学 派 二 分 天 下 的 局 面 , 看 来 成 功 的 希望 很 是 潍 甘 . 


注 1 : 个 i 是 袖 有 目 正 态 分 布 Ntag 的 随机 样本 ,a 各 
T 都 十 未 知人 参数 . 记 


y= 2 | 2 Ix 一 这 |. 
要 证 有明 ， 
i” 条件 分 布 y;|y 与 参数 无 关 . 
2” 第 件 分 布 my 与 0 有关. 


1 扯 忆 需要 让 明 ,是 因为 昌 则 4ryy 是 充分 统计 量 , 仁 ww 不 


起 tus) 的 充分 统计 量 , 邦 条 件 分 布 y:) yi 是否 与 参数 有 关 尚 不 清 
楚 . 


作 正 交 变 换 


| = ”hn 本 xz ,一 De 2 jn， 


三 1 


出 | | 2 ;Vz 上 只 与 Zo "ZZ 有关. 渤 因 和 作为 1 


线性 型 ,zx 与 x 一 + 正 交 ,因此 每 个 rz- 都 可 表 为 Z,;…,Z, 的 线 
性 攀 数 , 记 ys 二 gg(2 2.). 

由 子 Zot ,2 独立 同 分 布 且 公共 分布 为 WwWrI0:a) ,给 定 vy 一 
f 时 ,Za 在 空间 R” 的 以 原点 为 中 心 .e 为 半径 的 球面 十 
的 条 性 分 布 为 均 握 分布, 这 与 无 关 , 因 而 gz,… :2Z) 局 限于 此 


PA 


球面 上 的 (5 条件? 分 布 , 电 与 无关. 
2 的 证 明 稍 复 赤 一 点 ,为 丢人 述 方便 ,考虑 2 一 3 的 情况 ,一般 情 
况 的 证 明 完 全 类 羽 ， 
给 定 y= 二 cc 由 于 一 x 都 可 宕 沟 Z; 和 Za 的 如 性 哆 数 , 人 可 知 
集 所 一 人 72) yi 二} 在 (ZZ1) 平 画 上 是 由 一 些 有 限 或 无 限 
的 直线 段 组 成 . 它 不 是 一 个 球面 与 不 会 原点 人 设 e20): 酸 由 床 点 
至 此 集 攀 距离 符 记 为 4, 则 此 集 上 必 有 一 点 甚至 原点 的 距离 产 汪 
,itiE 上 一 人 一 3 定 光 信 
总 ;二 ZF ACZ,,Z;) 与 (0,0}) 的 距离 在 Cd,d 二 8] 
内 上}， 
于 二 25207 有 ZZ) 与 (0,0) 的 肥 离 大 于 4 十 2e}. 
考虑 4 个 条 件 概率 , 取 0 二 os,<o,: 
有 一 天 ds 十 El 各 )，g 一 忆 CC 二 28 六)， 
gs— Ped ydtely), ga= Pa ey | ys) 
此 处 PP 表示 条 件 概率 是 在 ec 一 5 时 计算 的 . 因为 
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Progr 人 

i 1 | 
3 

| zr 了 | a ] 1 
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Da 221 | 


可 和 五 : 王 五 .由 此 推出 


Ss Bs 
Br 右 


即 巡 < 反 全 这 就 证 明了 条 件 分 布 由 |y 与 有关. 因为 车 无 关 ， 则 


应 用! 二 
Bs Ef 
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着 尾 语 


天 1930 年 代 末 期 ,以 Student、 费 区 和 汞 、 爱 根 。 度 尔 进 和 豪 曼 
六 主将 , 自 捞 纪 初 开 如 的 这 一 波 数 理 统计 学 的 大 发 展 ,急于 告 一 自 
落 . 数理 统计 学 脱 去 了 19 世纪 时 那 种 仁和 玲 的 描述 性 状态 ,成 长 为 
一 个 符合 现代 数学 严格 性 标 淮 的 学 科 ,; 这 个 时 期 无 论 从 了 哪个 意义 
香 部 足 数 理 统 计 发 展 史 上 的 一 个 黄金 时 伐 . 

随 着 这 个 时 期 的 结束 ,开始 了 两 个 有 关联 的 进程 ,对 未 来 数理 
统计 党 爱 展 趋势 有 重大 的 影响 . 这 就 是 英国 在 国际 统计 学 界 的 无 
1 权威 日 潮 消 如 .以 及 国际 统计 学 主要 中 心 牧 向 美国 . 这 并 非 是 莫 
国 统 计 学 家 的 过 错 所 致 ,20 世纪 和 初 几 十 年 英国 统计 学 独步 天 下 的 
局 面 .是 出 请 名 因 素 汇 合作 用 所 致 . 13 世纪 的 遗产 ( 碟 们 在 第 七 章 
提起 过 ,统计 学 中 心 由 欧陆 转向 美国 始 于 13 氨 纪 后 期 ,并 志 难 办 
的 流出 大 物 的 出 现 , 其 他 国家 的 相对 莫 后 (如 美国 在 1930 年 代 合 
格 的 统计 学 教师 也 不 易 找 ) ,与 由 于 上 上述 情 识 及 英国 的 一 等 独 峡 地 
他 对 域外 人 玫 的 聚焦 作用 等 .即使 设 有 二 战 的 散 响 ,这 种 状 癌 也 不 
可 能 长 久 维 持 下 去 ,二 战 不 过 是 加 速 了 事件 的 进程 而 已 . 

知 一 代 的 统计 界 权 威 相 继 秤 世 , 卡 尔 :皮尔 进 在 1936 年 ， 
Student 在 1937 年 , 尤 尔 到 195] 年 ,但 在 1930 年 兹 已 不 活 牙 了 . 
新 锐 一 辈 , 奈 曼 在 1938 年 离 去 一 -英国 的 体制 使 他 难于 获得 一 个 
逢 当 的 职位 , 爱 根 ， 充 尔 示 接替 他 父亲 担 仔 系 主 任 和 4 生物 计量 
主编 ,忙于 行政 事务 ,虽然 也 出 现 了 父 巴 特 芋 特 、 芯 特 肯 和 叶 芯 等 
有 作为 的 统计 学 家 ,但 和 费 融 尔 这 右 人 人 物 相 沸 还 不 在 一 个 数量 级 ， 
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不 足以 重 振 英 国 统计 蔡 日 的 辉煌 . 

费 鞭 尔 还 健在 ,在 科研 上 仍 很 活 牙 .但 毕竟 已 过 知 傅 之 年 ,不 
冉 处 于 一 生 最 有 创造 力 的 阁 蜂 时 期 . 自 1940 年 到 1962 年 他 去 记 ， 
共 发 表 了 论文 124 篇 ,属于 统计 学 方面 的 约 40 篇 左右 ,为 数 不 等 
少 . 伍 从 内 容 上 看 ,多 属于 前 期 工作 的 进一步 发 挥 , 原 创 成 分 相对 
少 一 些 , 这 可 从 下 述 事 实 得 到 印证 . 1978 年 ,美国 明尼苏达 大 学 举 
办 了 -一 个 系列 讲座 回顾 费 软 尔 统 计 学 研究 成 果 的 意 六 ,从 出 版 的 
文集 丰 . 发 言 者 评介 晨 费 敬 尔 的 工作 , 除 个 别 外 ,都 是 1940 年 以 前 
的 , 费 感 尔 在 1957 年 退休 ,到 1962 年 他 去 诗 的 5 年 中 ,不 少时 间 
在 国外 , 特 员 是 独 大 利 亚 南部 休 远 的 城市 阿 德 革 德 (他 的 文集 最 早 
是 阿 德 药 德 大 学 出 版 的 ). 他 1946 年 重 访 美 国 时 发 出 的 感 咽 ( 见 第 
十 章 ) 确 也 反映 了 他 对 战 后 数理 统计 学 的 影响 的 意 落 ,这 是 英国 学 
派 影响 衰落 的 最 高 象 社 意义 的 事件 . 

“后 竹 歌 尔 时 期 "数理 统计 学 逐渐 倾向 于 数学 气 昧 较 重 的 研究 
风气 ,和 仍 乎 不 应 视 为 个 别 或 少数 统计 学 家 (如 京 曼 ) 的 导向 作用 ,而 
是 有 其 必然 的 因素 存在 .在 20 诗 纪 之 前 本 无 “专职 ”的 数理 统计 学 
宗 ,统计 学 家 都 是 某 一 专门 学科 领域 的 专家 , 凤 工 作 上 的 需要 研究 
数据 分 析 问 题 而 介 人 统计 学 . 高 尔 登 . 威 尔 登 , 埃 其 温 斯 以 至 卡尔 
* 友 尔 地 都 是 这 个 情况 . 由 皮尔 避 . 威 尔 登 等 人 于 1901 年 创刊 的 
20 世纪 前 期 一 份 主要 的 统计 杂志 命名 为 “生物 计量 ", 可 以 透露 此 
中 消息 . 费 葡 尔 基 本 上 记 可 列 人 这 种 情况 ,他 在 过 传 学 方面 的 名 声 
不 亚 于 统计 方面 ,他 的 研究 论文 不 少 发 表 在 4 优生 学 杂志 》. 约 东 . 
Student 更 是 如 此 ,这 个 背景 孕育 了 英国 统计 学 讲求 实用 .不 尚 纯 
理论 研究 的 传统 ,这 是 一 个 非常 好 的 传统 ,今日 不 少 对 当前 统计 学 
发 屡 状 疯 不 满意 的 学 者 ,也 还 在 号 召 以 回 到 这 种 传统 琳 纠 正统 计 
学 发 展 中 的 妨 向 . 

但 事情 还 有 男 外 的 一 面 ,卡尔 ， 皮 尔 慎 - 费 葡 和 尔 那 个 时 代 , 统 计 
方法 的 武 座 还 非常 贫乏 ,实用 工作 者 可 沿用 的 成 法 很 有 巾 , 要 解决 
实际 问题 就 意味 着 要 创造 新 方法 . 皮尔 示 等 的 吉大 和 成 功 之 处 ,就 
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在 于 他 们 出 色 地 做 到 了 这 一 点 ,尤其 重要 的 是 ,他 们 创立 的 方法 具 
有 通用 性 ,并 不 限于 他 们 关心 的 特定 问题 . 例如 费 软 尔 创立 的 方差 
分 析 与 试验 设计 ,本 是 源 于 农业 试验 的 需要 .而 其 成 果 可 用 村 工业 、 
社会 和 经 济 诸多 方面 . 但 这 种 情况 也 不 是 经 常 都 会 有 的 ,和 多少 与 他 
们 的 活动 年 月 还 处 在 近代 统计 学 的 "草创 "时 期 有 关 . 对 后 来 者 来 
说 ,这 种 模式 的 研究 方法 ,对 于 人 微 出 重大 成 果 的 希望 来 说 ,困难 的 程 
度 必 定 会 增加 ,而 理论 研究 则 可 能 是 一 个 更 有 吸引 力 的 方向 . 
当时 的 客观 形势 也 要 求 加 强 理 论 研究 . 自费 葡 尔 到 瓦尔 德 这 
20 余年 中 ,先后 树立 了 点 估计 .假设 检验 .方差 分 析 、 区 间 估 计 和 
统计 雇 策 函数 的 理论 框架 ,这 还 只 能 说 是 给 理论 统计 学 这 座 大 大 
建立 了 一 个 “外 沉 ”, 其 "内 部 装修 "还 有 大 量 的 工作 要 化 ,这 涉及 许 
多 要 用 到 较 高 深 和 精细 的 数学 的 问题 . 例如 点 估计 的 大 样本 理论 ， 
费 葡 尔 只 提出 了 一 个 很 粗 的 大 网 ,经 过 以 后 约 40 年 众多 学 者 的 努 
力 . 才 把 所 涉及 的 问题 基本 上 理 清 类 绪 , 应 该 说 这 种 工作 也 是 有 很 
强 的 实际 背景 的 ,不 能 贱 斥 为 纯 数学 的 游戏 , 由 于 “遗传 基因 "的 作 
用 ,英国 当年 统计 界 对 这 类 理论 研究 的 态度 ,至 少 可 以 说 是 积极 性 
不 高 . 这 从 奈 曼 关于 置信 区 间 的 竟 基 性 论文 被 退 稿 ( 见 第 十 章 ) 一 
事 可 以 充分 看 出 ,这 样 在 英国 也 就 缺乏 从 事 这 种 研究 的 人 才 储 备 ， 
他 们 在 数理 统计 学 的 下 一 步 发 展 中 不 能 起 到 领导 新 潮流 的 作用 ， 
也 就 是 可 以 理解 的 了 . 
美国 当时 的 情况 则 太 有 不 局 . 当然 不 能 以 “一 片 空白 "来 形容 美 
国 当 年 的 统计 学 状况 ,但 与 英国 比 确 是 落后 了 许多 年 ,当时 正 处 在 
从 英国 引进 这 门 学 科 的 过 程 中 . 1930 年 代 费 歇 尔 和 这 曼 等 人 曾 由 美 
国 农业 部 和 若干 大 学 主持 邀 情 去 美 讲学 ,引起 热烈 的 反响 . 当时 部 
泰 林 已 在 美国 建立 了 第 一 个 统计 系 . 《数理 统计 学 纪事 》 也 已 创刊 多 
年 ,为 统计 学 的 大 发 展商 定 了 良好 的 基础 ,缺乏 的 是 一 个 有 威望 呈 
有 能 力 并 处 在 科研 第 一 线 的 领头 人 物 . 奈 曼 在 这 个 时 候 去 美 ,在 时 
机 上 上 可 以 说 恰到好处 . 更 早 , 美 国 的 条 件 还 不 甚 具备 ,他 自己 的 威望 
也 还 不 够 ,更 晚 , 那 张 纸 上 可 能 己 画 了 不 少 图 画 , 他 施展 的 余地 可 能 
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受到 限制 . 比如 他 1938 年 一 到 伯克利 如 天 就 担任 了 该 系统 计 实 验 
室 主 任 . 如 果 该 机 构 旱 已 建立 并 由 一 和 位 权威 人 人物 主 持 , 他 在 加 大 世 
可 能 与 在 太 学 学 院 一 样 无 能 为 力 .不 能 施展 自己 的 抱负 
笔者 十 年 前 在 美 作 访问 学 者 期 闻 , 在 与 同行 的 交 读 中, 了解 到 
当时 美国 统计 学 家 中 还 存在 这 样 一 种 看 法 :当时 (1937 年 一 1938 
年? 奢 大 决定 从 英国 引进 统计 学 术 带 涉 人 时, 曾 把 费 软 尔 和 他 的 弟 
了 闻 也 考 处 在 内 { 计 曼 传记 一 - 书 中 也 曾 提 到 此 事 ) ,如 果 当 年 选择 的 是 
费 歌 尔 , 以 后 美国 统计 学 的 发 展 可 能 是 男 外 一 个 样子 . 历史 无 法 假 
是, 此 事 不 好 置 评 . 但 看 来 也 难 . 从 奈 曼 传记 一 书 看 , 泰 营 的 中 选 除 
个 大 人 性格 方 面 的 因素 外 ,一 个 重要 原因 是 当时 美国 统计 在 理论 和 教 
学 这 方面 太 东 后 , 吸 需 这 方面 的 人 才 . 伯克利 加 夫 数 学 系 主 尾 埃 六 
斯 (是 他 主导 了 引进 订 曼 的 事 ) 的 个 人 看 法 也 起 了 相当 的 作用 ,地 想 
要 找 一 个 个 性 极 强 的 中 心 大 物 来 建立 一 个 理论 统计 学 学 派 ". 
示 受 对 统计 学 的 数学 理论 基础 的 重视 是 一 贯 的 . 1937 年 ,他 
配 爱 根 合作 创办 了 一 个 统计 杂志 《统计 学 研究 纪事 》, 在 第 1 卷 的 
前 这 中 编辑 们 指出 ,他 们 的 拖 负 是 .新 杂志 “要 为 统计 学 理论 达到 
其 他 数学 分 支 通常 具有 的 精确 水 平 作出 贡献 估计 这 主要 反映 了 
东 受 的 驶 点 .传记 } 中 还 有 一 处 提 到 , 奈 虹 强调 严格 . 他 在 讲课 中 
总 是 说 "这 并 非 像 它 看 上 去 那么 显然 ”, 而 费 歌 尔 则 相信 和 直觉, 有- 
次 一 个 学 生 为 证 明 一 个 收 合 性 而 绞 尽 脑 社 , 费 融 尔 让 他 试 N 二 1， 
2,3, 然 后 说 “完全 正确 ”. 这 个 细节 很 能 反映 这 两 位 大师 对 于 在 统 
计 尝 中 对 数学 严格 人 性 的 要 求 的 不 局 看 法 . 
京 曼 扶 记 的 作者 认为 ,对 泰 曼 的 选择 "使 美国 统计 学 办 发 生 戏 
剧 性 的 变化 ”, 这 大 概 是 指 此 举 导 致 了 那 以 后 美国 统计 学 研究 的 善 
重点 装 到 与 纯 数学 有 较 多 关联 的 问题 上 . 不 过 ,这 种 趋势 是 否 主 要 
由 蒜 曼 的 到 来 所 促成 ,还 有 考虑 的 余地 . 20 世纪 早期 统计 学 研究 
之 着 重 实际 面 不 崇尚 理论 ,除了 19 世纪 的 遗产 外 ,一 个 重要 原因 
起 当时 这 门 学 科 的 数学 框架 尚未 建立 ,没有 为 数学 理论 研究 的 发 


展 近 清场 地 . 到 一 定 阶段 ,数学 内 在 的 发 展 能 自行 产生 新 问题 ,从 
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实用 问题 出 发 研究 通用 方法 并 非 易 事 ,不 易 取 得 成 末 . 这 些 因 素 都 
会 有 力 地 将 不 少 新 一 代 的 统计 党 家 引 向 纯 理 论 研究 的 方 回 .在 美 
图 有 一 个 流传 的 品 与 :publish or purish”( 不 宕 表 就 天 亡 ) ,提升 
职称 等 许多 与 个 人 利益 有 关 的 全 都 取 深 于 凶 发 表 , 搞 理论 较 血 达 
到 这 一 目标 .这 种 情 沈 在 我 国 统计 学 界 同 样 是 一 个 问题 ,看 来 不 能 
把 这 种 偏 问 主 要 归 答 于 诸 曙 的 从 导 . 

美国 统计 学 界 著 名 的 元 老 图 基 (J. WW. Tukey) 在 1962 年 发 表 
了 一 篇 有 很 太 影 响 的 长 文 4 数 据 分 析 的 未 来 在 此 文中 他 把 数理 
统计 学 工作 分 成 两 类 . 一 类 是 对 数据 分 析 有 贡献 的 ,对 男 一 类 ,他 
说 :一 忻 数 理 统 计 学 工作 ,如 果 即 使 从 长 期 的 观点 看 , 巷 至 通过 曲 
折 的 环节 ,也 不 能 对 数据 分 配 的 实践 有 所 贡献 , 则 应 视 为 一 件 纯 数 
党 工作 . 三 从 纯 数 学 的 标准 去 评价 ”. 以 下 还 说 ,任何 一 件数 理 统 计 
学 工作 必须 从 这 二 者 (实用 或 纯 数 学 ) 之 一 的 标准 中 寻求 其 合法 
性 . 对 于 那 种 这 两 个 标准 者 不 符合 的 工作 ;必然 会 成 为 一 时 的 过 
客 ,最 终 从 人 们 的 视线 中 消失 . 

这 里 说 到 了 问题 的 要 害 , 战 后 数理 统计 党 发 展 中 的 偏向 (有 的 
学 青 志 为 是 "人 危机 ;不 在 于 理论 文章 比重 的 增加 ,而 在 于 这 些 理论 
文章 中 ,大 量 的 是 屠 种 上 述 两 个 标准 都 不 符合 的 工作 . 许多 文章 条 
件 一 六 堆 ,结论 繁 秽 复杂, 方法 上 也 往往 走 的 老 套 , 不 仅 对 数据 分 析 
著 无 伸 益 ,也 缺乏 数学 美 , 从 纯 数 学 的 观点 看 也 没有 冤 大 意 义 ， 

图 基 的 上 述 论 文 是 一 个 信 叶 ,表明 美国 统计 界 一 部 分 对 现状 
不 满 的 党 兰 ,开始 对 这 种 儒 向 进行 批评 并 导 牧 纠正 的 途径 , 这 种 努 
力 开 始 产 生 了 效果 ,统计 学 家 瑞 德 在 评介 弗 革 塞 的 一 篇 关于 结构 
概率 的 文章 时 写 道 ， 

“和 在 1960 年 代 , 特 别 在 美国 ,对 将 严格 的 数学 方法 用 于 统计 推 
断 , 特 别 是 对 于 推断 程序 的 优良 性 ,有 非常 大 的 着 重 . 费 葡 尔 对 统 
计 扒 断 的 做 法 与 此 很 不 相同 ,而 弗 菜 塞 觉得 在 统计 学 界 中 费 软 尔 
不 如 正 地 遭 到 了 忽视 .从 那 时 起 , 费 葡 尔 在 统计 史上 的 卓 赵 地 位 用 
多 种 方法 重建 起 来 ,一 个 例子 是 1980 年 出 版 了 由 人 菲 因 怕 格 和 欣 众 
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利 编辑 出 版 的 文集 . “这 就 是 前 面 提 到 的 1978 年 美国 明尼苏达 系 
列 讲 应 的 文集 ). 另 一 个 有 象征 意 广 的 事件 是:1930 年 创刊 的 4《 数 
理 统 计 学 纪事 4 在 1973 年 分 为 统计 和 概率 其 个 杂志 ,前 者 的 名 称 
是 《统计 学 纪事 》, 从 原 省 中 去 掉 了 “数理 "这 个 字眼 . 

在 实际 的 努力 方面 ,如 前 有 一 定 影 啊 的 还 是 由 喜 基 发 起 .并 有 
一 些 有 影响 的 追随 者 所 提 佛 的 “数据 分 析 ”. 图 基 1962 年 文章 已 穆 
划 出 了 他 主张 的 基本 轮廓 ,殿后 不 少 学 者 就 这 个 题目 发 表 了 不 少 
文章 及 专著 . 其 基本 精神 ,可 摘 引 这 些 著作 中 的 一 些 主 张 来 说 明 . 

名 我 们 应 当 寻 求全 新 的 问题 来 研究 . 

名 我 们 应 当 在 更 现实 的 框架 下 去 研究 老 问 题 . 

种 我 们 应 当 寻 求 观测 数据 的 原来 不 熟悉 的 处 理 方 法 ,并 措 清 
禁 其 有 用 的 性 质 . 

这 几 杀 关系 到 研究 题材 . 以 往 研 究 的 问题 不 少 是 学 究 式 的 ,于 
现实 无 补 , 应 以 全 新 而 有 用 的 问题 取代 之 . 以 往 许 多 研究 ,为 了 迁 
纹 数 学 上 的 方便 ,可 能 采取 了 一 种 过 于 简化 的 模型 或 不 现实 的 候 
定 ,应当 模 据 实 际 中 出 现 的 情况 回 以 调整 ,使 问题 更 具有 现实 意 
浆 ;不 要 掏 交 于 习惯 上 常用 的 一 些 方法 如 样本 均值 ,线性 回归 之 
类 ,要 寻找 一 些 更 好 的 整理 数据 的 方法 , 弄 清楚 其 有 用 的 性 质 ,以 
备 选 用 . 

和 计 多 人 认为 重要 的 是 从 包 会 参数 的 概 举 模型 出 发 ,然后 去 
为 参数 找 一 个 好 的 估计 … 许 多 估 记 记 了 :数据 分 析 可 雇 且 有 时 更 
宜 于 在 给 定 概 率 模型 之 前 进行 ， 

者 数据 分 析 寻 求 的 是 有 用 性 而 非 严格 性 . 

全 数据 分 析 必 须 容许 适当 程度 的 错误 ,以 使 所 获 的 不 需 全 的 
证 据 可 以 经 党 司 示 一 个 上 正确 的 解法 . 

名 数据 分 析 使 用 数学 论证 和 结果 ,是 以 之 作为 判断 的 一 种 根 
据 , 而 非 用 于 证 明 或 方法 合法 性 的 印记 . 

这 儿 杀 是 批评 现行 数理 统计 党 中 程式 化 的 候 硬 做 法 ;必得 要 
连 择 概率 模型 ;必得 要 对 参数 寻求 最 优化 的 估计 ;必得 对 所 用 施 法 
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要 有 严格 的 数学 证 明 . 这 些 作 法 把 数学 上 的 合法 性 和 形式 上 的 指 
标 ( 优 良性 .精度 可 靠 度 之 类 ) 置 于 对 现实 数据 的 充分 考察 以 从 中 
挖 据 更 多 信息 这 一 更 重要 的 委 标 之 上 , 守 致 形式 上 上 谅 亮 出 于 夭 际 
问题 无 补 的 解 . 

各 存在 一 个 关于 " 找 最 优 解 ” 的 进一步 的 困难 .经营 , 在 找到 
一 个 最 优 明 后 , 某 个 人 福 着 这 个 方 回 找到 了 更 好 的 解 , 而 他 做 到 这 
一 点 只 通过 简单 地 指出 还 存在 一 个 未 曾 考 虑 到 的 因素 . 依 我 的 经 
验 ,在 找到 一 个 适 麻 好 的 解 后 ,很 少 值 得 再 费 动 去 寻找 最 优 解 . 这 
个 时 间 更 好 是 花 在 脚踏实地 的 研究 工作 上 . 

这 些 人 议论 里 然 也 指出 了 数据 分 析 该 亲自 的 原则 ,也 批评 了 教 
条 二 地 对 符 现 行 统计 方法 的 做 法 .但 县 体 访 如何 做 呢 ? 这 问题 在 诸 
家 的 作品 中 议和 得 不 多 ,原因 当然 大 局 业 难 ， 了 地 有 些 基本 上 仍 是 属于 
尿 则 性 的 意见 . 

全 多 用 人 简 捍 时 、 易 行 易 懂 的 上 方法 ， 

全 稳健 性 重 于 有 效 性 . 

雪 数据 分 析 是 "数据 研究 ”data investigation) ,而 传统 的 统 
站 方法 是 "数据 姓 理 ”. 

“数据 处 理 ”, 意 味 着 按 一 种 弃 定 的 程式 去 处 理 数 据 , 即 套 公 
式 ; 数据 研究 "强调 人 的 判断 的 重要 作用 :针对 具体 情况 选择 较 好 
的 方法 ;必要 了 时 作 适 当 的 变通 ;对 分 析 结 果 的 解释 采取 不 衣 从 而 是 
有 批判 性 移 立 场 等 . 

1983 年 .在 介 克 利加 去 举 行 的 纪念 统计 学 家 床 曼 各 基 弗 的 一 
次 会 说 上 ,统计 学 家 休 伯 发 表 了 一 篇 题 为 《名 分 未 定 的 数据 分 析 》 
(lata analysis Im search of an identity) 的 立 童 ,向 从 这 文 题 就 可 
以 看 出 :对 “数据 分 析 究 竟 是 什么 "这 个 问题 ,还 没有 一 个 清楚 的 回 
省 ,因而 ,至 少 在 近期 内 ,也 就 谈 不 上 申 它 来 取代 传统 统计 学 的 地 
全 而 成 为 发 展 的 主流 了 . 依 本 书 作 者 的 观点 看 ,在 一 定 程度 上 可 以 
说 ,“ 数 据 分 析 ” 的 提倡 者 所 主张 的 ,是 数理 统计 学 的 "艺术 化 ”这 
倒 应 了 不 列 旺 百科 全 书 中 “统计 学 是 收集 和 分 析 数 据 的 艺术 ”的 说 
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法 .因为 ,图 基 等 人 一 方面 不 否认 原 有 统计 方法 的 作用 ,数据 分 本 
论 者 一 般 都 把 更 有 筑 计 方法 视 为 数据 分 析 的 组 成 部 分 ,一 方面 又 
主张 不 谍 字 这些 方 法 中 和 的 茜 本 规 冰 ,如 概率 模型 ,对 不 确定 性 作 精 
确 的 计算 或 估计 -最 优 淮 则 和 最 优 解 等 ,他 们 不 是 无 条 件 地 反对 这 
一 些 , 而 是 主张 对 此 采取 一 -种 灵 话 的 访 度 :合用 则 留 ; 不 合用 则 去 ， 
而 合用 或 不 合用 ,很 大 程度 上 徘 人 的 类 断 , 虽 则 一 般 讲 这 种 判断 并 
韭 忧 大 的 好 悉 . 而 是 与 问题 的 专业 知识 和 经 验 有 关 , 因 而 必然 合 有 
“亏本 "的 成 分 .或 看 说 ,把 数理 统计 学 的 “三 科 学 "性 质 软 化 一 些 . 

这 种 主张 的 出 现 , 不 完全 是 出 于 对 统计 学 研究 过 分 数学 化 的 
怖 回 的 一 种 反动 ,在 很 大 的 程度 上 与 高 性 能 计算 机 的 出 现 有 关 . 数 
据 分 析 的 基本 命题 是 "从 数据 中 控 据 尽 可 能 多 的 信息 ”, 故 而 有 ”* 数 
据 采 搬 ”(data mining}) 的 提 法 , 其 反面 的 依 必 是 不 要 把 重点 放 在 
模型 上 ,或 说 得 确切 一些, 不 要 一 开始 就 从 某 种 既定 的 寞 型 出 发 ， 
模型 应 当 在 对 数据 充分 控 据 的 基础 上 产生 ,可 是 如 果 数 据 量 太 少 ， 
这 个 做 起 来 就 很 难 . 例如 在 可 靠 性 分 析 中 某 种 寿命 有 了 五 六 个 数 
据 , 在 天命 服 从 其 种 分 布 ( 如 指数 分 布 . 威 布尔 分 布 之 类 ) 的 模型 
下 .还 可 所作 些 统 计 分 析 . 如 什么 也 不 假定 , 单 从 这 很 少 几 个 数据 ， 
就 很 礁 控 出 和 作 么 重要 的 情 息 来 . 局 时 ,数据 分 析 密 少 有 一 种 " 试 错 ” 
ttry and error 性 质 , 有 和 时 需要 分 析 许 多 模型 或 方案 ,使 用 多 种 不 
后 的 方法 .或 者 需要 进行 大 量 的 模拟 ,这 和 多 种 结果 可 与 经 验 和 班 实 
比 轮 以 次 定 取 会 ,所 涉及 的 极 大 的 计算 量 .在 计算 机 时 伐 以 前 是 不 
可 想像 的 .计算 机 提供 了 这 种 可 能 , 即 打 破 传 统统 计 方 法 过 客 的 条 
条 框框 的 束 刍 的 可 能 ,这 为 "数据 分 析 ” 思 想 的 产生 准备 了 最 有 力 
的 条 性 . 

最 有 可 能 的 前 途 或 许 是 ;数据 分 析 不 大 可 能 发 展 成 一 门 符合 
现今 数学 分 文 严 格 性 标准 的 那 种 “全 ?科学 分 支 , 而 会 以 一 个 其 领 
域 没 有 明确 界定 的 实体 而 存在 ,其 中 将 包括 现行 的 一 些 有 用 的 统 
计 方 法 ,数学 方法 ,计算 机 软件 将 在 其 中 起 重大 的 作用 ,也 会 强调 
数据 分 析 工 作者 与 其 他 应 用 学 科 保 持 密切 联系 的 重要 性 . 它 不 会 
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取 民 现行 的 数理 统计 学 ,得 未 来 的 实用 者 可 能 会 更 多 地 采用 数据 
分 析 论 者 所 主张 的 那 种 原则 和 和 方法 去 处 理 他 们 在 工作 中 涉及 的 数 
据 处 理 癌 题 . 

几 上 年 来 .一 些 对 "数据 统计 学 而 何 处 去 "这 个 问题 感到 关心 
的 统计 学 家 ,通过 举办 专题 讨论 会 和 撰写 论文 的 形式 ,表达 他 们 对 
这 一 问题 的 看 法 并 提出 一 些 主张 . 如 1967 年 在 美国 威斯康星 大 学 
举办 的 "统计 学 的 未 来 ”讨论 会 . 1974 年 在 加 拿 大 埃 德 蒙 顿 举办 的 
“统计 党 的 方向 ”讨论 会 等 ,发 言 的 主旨 ,与 前 述 数 据 分 析 论 者 原则 
上 上 一样, 不 外 是 批评 当今 理论 研究 与 实际 脱节 的 现象 ,在 应 有 玫 中 拘 
泥 于 模型 和 概率 论证 等 , 世 担 出 过 一 些 具 怀 的 建议 ,如 拆除 (统计 ) 
系 .常会 和 沫 志 的 寺 墙 ,或 励 其 他 学 科 的 侵 人 :杂志 编辑 部 应 扩大 
视 对 ,只 发 表 有 用 的 交 章 ;要 研究 困难 问题 ,不 满足 于 对 简单 问题 
的 加 党, 以 此 改革 统计 教学 ,多 看 看 具体 工作 人 人 员 是 如 何 分 析 数 据 
风 . 尘 等 . 这 些 建议 ,相当 部 分 已 有 所 实施 . 笔者 1980 年 代 在 美国 
一 所 大 学 的 统计 系 作 访 向 学 者 , 考 察 过 该 系 应 用 统计 课 的 情况 ,学 
生 的 习题 多 是 取 自 各 应 用 领域 现实 数据 的 分 析 问 题 ,学 生 相当 多 
了 的 时 间 化 在 计算 机 房 里 ,利用 统计 软件 来 处 理 这 些 数据 的 和 分析 问 
怖 . 石 外 :一 些 统 计 深 志 ，, 划 《Techneormnetrics 站 Biormetries 让 b 至 
JASA ,其 世 载 的 论文 密 系 与 其 他 实 届 领域 结合 的 问题 ,或 一 般 统 
计 方 法 的 问题 , 纯 数 学 的 理论 文章 比重 很 小 . 

1997 年 ,统计 学 家 休 伯 发 表 了 一 篇 题 为 < 对 统计 学 未 来 的 狂 
测 ?的 文章 ; 休 伯 是 当代 有 影响 的 统计 学 家 ;他 在 六 七 十 年 代 提 出 
时 关于 位 置 参 数 及 一 般 线 性 模型 的 稳健 估计 一 种 方法 (M4 估计 )， 
饿 认为 是 20 出 纪 统 计 学 的 重要 成 就 之 一 . 他 后 来 成 为 "数据 分 析 ” 
这 一 思 讲 中 的 一 个 重要 人 人 人物. 在 上 述 论 文中 ,他 回顾 了 自 图 基 
1962 年 文章 《数据 分 析 的 末 来 ?发 表 后 直到 现在 的 几 十 年 间 , 一 部 
他 统 计 学 家 对 统计 学 未 来 发 展 方 向 的 讨论 情 沉 和 和 意见 ,他 自己 也 
担 出 了 两 点 有 意思 的 看 法 . 

第 一 ,他 提出 了 一 种 螺旋 式 的 统计 学 发 展 的 观点 . 笔者 理解 他 
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的 意思 是 一 个 “否定 之 否定 他 画 的 那 条 螺 线 起 点 是 格 请 特 的 # 观 
罕 } 一 书 ( 抑 第 六 章 ), 向 外 伸展 至 于 无 穷 . 第 一 阶段 太 致 上 和 让 起 点 
至 于 卡 芝 -上 成 尔 计 .然后 经 过 Student- 疙 和 驹 示 一 让 坚 一 笑 根 ， 上 应 
不 各 -了 所 尔 德 .统计 学 由 前 一 有 阶段 描述 的 性 质 上 天 到 以 严格 数学 为 
基础 的 推断 性 原 , 这 是 一 个 否定 . 接着 将 要 出 现 的 有 是 第 二 个 否定 ， 
其 内 容 十 数据 分 析 , 它 在 一 定 意义 二 可 视 为 向 第 一 阶段 描述 统计 
的 回复 .当然 是 在 提高 了 的 意 闵 上 .这 提高 反映 在 数据 分 析 要 吸收 
膨 一 阶段 的 戌 沼 并 有 计算 机 这 一 有 力 工 具 的 帮助 ,这 莉 是 是 先 撕 
述 性 阶段 所 不 具备 的 . 这 一 看 法 的 实质 是 ,肯定 了 数据 分 析 是 统计 
党 未 来 发 展 的 方向 . 

第 二 ,如 果 对 现今 统计 学 不 进行 “改革 ”一 一 这 改革 是 指 将 统 
计 学 的 发 展 转 到 数据 分 析 的 畔 道上 ,统计 学 可 能 会 发 生存 在 注 的 
乱 杖 . 他 指 的 是 这 样 一 种 情况 :数理 统计 学 家 的 工作 将 不 为 实用 部 
站 的 人 所 注意 ,统计 学 将 会 消融 到 一 些 实 用 科学 领域 中 去 ,在 那 
里 ,一些 有 能 力 并 对 统计 学 抱 实用 取向 的 学 者 ,将 在 各 领域 内 与 该 
讨 域 专 夫 发展 针对 该 领域 的 统计 方法 ,这 种 情况 和 与 20 世纪 以 前 统 
计 党 的 发 展 情况 相似 . 当时 发 展 统计 方法 的 人 都 不 以 为 自 已 是 统 
计 学 过 . 他 们 对 自己 领域 中 出 现 的 数据 分 析 问 题 有 兴趣 ,并 常 以 结 
合身 己 专 业 领 域 的 方式 去 研究 它 , 高 尔 登 . 威 尔 登 和 卡尔 、 皮尔 导 
等 前 是 典型 的 例子 . 因此 , 休 伯 这 一 观点 与 其 前 一 观点 一 样 ,总 的 
部 是 认为 统计 党 发 展 有 向 前 一 段 回归 的 形势 . 

对 这 一 切 谁 也 不 能 肯定 或 否定 . 有 一 点 也 许 是 不 汉人 能 钥 认 
问 的 : “后 费 葡 尔 时 代 ” 的 统计 学 确实 谈 不 上 有 和 多少 突破 性 的 成 就 . 
当前 的 统计 学 理论 研究 确 有 比较 显著 的 与 实际 脱节 的 现象 ,积累 
了 不 少 忒 盾 , 疝 这 可 能 意味 荐 ,新 一 轮 的 突破 性 进展 正在 孚 育 中 ， 
蔚 也 和 许 怠 是 数据 分 析 ? 这 个 仙 怕 还 不 能 说 得 太 早 . 
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